Các yếu tố ảnh hưởng đến tính tin cậy của kết quả

Một phần của tài liệu phantichsolieudinhluong2_spss_ytcchanoi_176pages (Trang 146 - 149)

CHƯƠNG 5 : TÍNH CỠ MẪU

5.2. Các yếu tố ảnh hưởng đến tính tin cậy của kết quả

5.2.1. Ý nghĩa thống kê và ý nghĩa ngữ cảnh

Ngoài việc tăng tối đa khả năng câu hỏi nghiên cứu sẽ được trả lời một cách

khơng có sai số, một mục đích chính khác của việc thiết kế nghiên cứu là đảm bảo

không lãng phí nguồn lực. Khía cạnh này có thể dựa vào số lượng mẫu trong nghiên cứu. Thật vơ ích khi mẫu nghiên cứu là 1000 trong khi chỉ cần 100 là đủ và tương tự nghiên cứu có thể là khơng có giá trị nếu mẫu nghiên cứu chỉ là 10 người trong khi phải cần tới 100 người. Làm thế nào để có thể xác định được mẫu là bao nhiêu thì đủ? Thực ra, nghĩa của từ “đủ” là gì?

Mẫu nghiên cứu là đủ khi kết quả nghiên cứu là đáng tin cậy và được chấp nhận.

Điều đó có nghĩa là nếu kết quả đưa ra có thể chỉ được sự khác nhau giữa hai nhóm thì

chúng ta cần chắc chắn rằng việc giải thích này khơng giống như bị ảnh hưởng đến của những dao động khi lượng giá. Chúng ta mong muốn tránh được kết quả dương tính hoặc âm tính giả.

Thông thường, một kết quả sẽ không được cân nhắc và đưa vào trong báo cáo trừ khi kết quả so sánh đạt tới “có ý nghĩa thống kê, p < 0.05’. Chúng ta thường làm nghiên cứu và tìm ra một sự khác nhau mà lại khơng có ý nghĩa hoặc điều trái ngược, chúng ta

có thể tìm thấy một kết quả khác nhau có ý nghĩa thống kê nhưng khơng có ý nghĩa trong thực tế. Điều này có thể là nhỏ, sự khác nhau khơng có ý nghĩa thống kê của một can

thiệp trên thực tế có thể có ý nghĩa y tế cơng cộng lớn nếu sự thay đổi nhỏ đó tác động

đến toàn bộ quần thể . Ngược lại, một can thiệp có thể dẫn đến một sự khác biệt lớn có ý

nghĩa thống kê cao nhưng lại khơng thích hợp nếu nó chỉ có thể áp dụng cho một số ít người trong quần thể.

Giải thích về phân tích thống kê nên dựa chủ yếu trên ý nghĩa ngữ cảnh, không phải trên ý nghĩa thống kê. Điều này thường khơng được trình bày rõ trong các sách thống kê. Giá trị p có thể chỉ được sử dụng để tuyên bố về “ý nghĩa” trong khi thiết kế nghiên cứu bao gồm cả tính tốn cỡ mẫu cho một giả thuyết được kiểm định. Trong

phạm vi cỡ mẫu, một kết luận âm tính giả là do cỡ mẫu quá nhỏ, và một kết luận dương

Q trình tính tốn cỡ mẫu cho một cơng trình nghiên cứu là để chắc chắn rằng chúng ta đạt được cỡ mẫu đủ lớn dựa trên đó chúng ta đưa ra kết luận về vấn đề y tế công cộng, chúng ta cũng đưa ra những phiên giải khác về sự khác biệt là có ý nghĩa thống kê hay không.

Điều đầu tiên của bất kỳ một tính tốn cỡ mẫu nào cũng là những trình bày về kết

quả của nghiên cứu này có tầm quan trọng như thế nào đối với sức khoẻ cộng đồng. Ví dụ, chúng ta hy vọng rằng chiến dịch tuyên truyền tăng cường sức khoẻ sẽ tăng nhận thức về chiến lược phòng chống HIV/AIDS lên 20% hoặc hơn nữa. Nếu sự cải thiện chỉ là 12%, nó khơng đủ ấn tượng để tiến hành chiến dịch này một cách thường xuyên, sự thay đổi này khơng đủ lớn với những chi phí nguồn lực đã bỏ ra. Vì thế mục đích của

chúng ta là phải thiết kế nghiên cứu với cỡ mẫu đủ lớn để có thể phát hiện sự cải thiện

tăng 20% hoặc hơn nữa có ý nghĩa thống kê. Chúng ta sẽ không quan tâm những sự khác biệt nhỏ hơn 20% mà khơng có ý nghĩa thống kê.

5.2.2. Sự biến thiên trong đo lường

Sự biến thiên trong đo lường là kết quả của các biến thiên cá thể và từng nhóm nếu chúng ta so sánh các nhóm. Với sự xuất hiện của sự biến thiên lớn trong đo lường giữa các cá thể, nó sẽ khó để phát hiện những sự khác biệt nhỏ.

Đặt hai khái niệm trên (sự khác biệt tối thiểu có thể tìm ra và sự biến thiên) vào

với ví dụ về chất lượng cuộc sống trong bộ số liệu nghiên cứu của chúng ta, ta có thể có giả thuyết rằng điểm chất lượng cuộc sống sau chấn thương là khác nhau giữa nhóm nạn nhân có thu nhập thấp và nhóm có thu nhập khơng thấp. Sự khác biệt trung bình là 5 hoặc cao hơn là mối quan tâm của các nhà nghiên cứu. Hãy đơn giản hố ví dụ này, giả

định rằng lấy mẫu gồm 10 người trong mỗi nhóm thu nhập (thấp và không thấp). Sự

khác biệt là 5 rất dễ dàng nhận ra trong việc so sánh tập hợp thứ nhất và tập hợp thứ 2 của các kết quả:

Điểm chất lượng cuộc sống của 10 người trong hai nhóm thu nhập

Thu nhập thấp: 31 31 32 33 34 35 36 38 40 41

Thu nhập không thấp 36 36 38 39 39 40 42 44 45 46

Điểm chất lượng cuộc sống không thay đổi nhiều (chạy trong khoảng 10 điểm) và

sự khác biệt trung bình 5 là thuyết phục – mặc dù hai nhóm có sự chồng chéo vẫn có sự thay đổi rõ ràng, điểm chất lượng cuộc sống ở nhóm thu nhập khơng thấp cao hơn nhóm thu nhập thấp

So sánh với một ví dụ mà sự khác biệt được lượng giá cao hơn. Điểm chất lượng cuộc sống của 10 người trong hai nhóm thu nhập

Thu nhập thấp: 31 32 34 38 40 41 46 48 49 51

Trong trường hợp này, sự khác biệt trung bình vẫn là 5, nhưng kết quả khơng

đựoc chấp nhận vì sự khác nhau quá lớn của các cá thể trong nhóm (chạy trong khoảng

20) và sự chồng chéo giữa hai nhóm cũng lớn.

Để đưa ra sự khác biệt, một cỡ mẫu lớn hơn là cần thiết để tìm ra sự khác nhau đáng tin cậy khi sự khác biệt tính được cao hơn.

Xem xét ví dụ về nhóm 20 người

Điểm chất lượng cuộc sống của 20 người trong hai nhóm thu nhập

Thu nhập thấp: 31 32 33 33 34 35 36 38 41 42 43 44 46 46 47 48 48 49 50 51 Thu nhập không thấp: 39 41 42 42 43 44 45 46 47 49 49 50 51 52 53 53 54 55 55 56

Với cỡ mẫu lớn hơn, chúng ta tin tưởng hơn rằng sự khác nhau giữa hai nhóm là thật sự; sự “thay đổi” giá trị chất lượng cuộc sống cao hơn là nhất quán hơn và được dựa trên số lượng nhiều hơn.

Với thống kê mô tả, chúng ta thường muốn đưa ra khoảng tin cậy cho độ chính

xác của các ước lượng thống kê (trung bình, tỷ lệ, tỷ suất chênh...). Sự khác biệt càng lớn, cỡ mẫu sẽ càng phải lớn để đưa ra số trung bình như nhau với độ chính xác như

nhau.

5.2.3 Sai lầm loại I và sai lầm loại II

Kể cả khi có sự khác nhau thật sự tồn tại trong hai mẫu đối tượng, chúng ta vẫn có thêm một vấn đề nữa ảnh hưởng đến độ tin cậy của các kết quả. Điều này liên quan đến việc các đối tượng trong mẫu mà chúng ta chọn có đại diện cho tồn bộ quần thể

hay khơng. Nếu hai nhóm đại diện được cho các quần thể của chúng thì sự khác biệt ở

trên có thể sẽ được lặp lại (nếu chúng ta chọn lặp lại nhiều lần thì sự khác biệt đó vẫn sẽ tồn tại). Nếu hai nhóm này khơng đại diện cho quần thể, sự khác biệt ở trên có hoặc

không thể phản ánh đúng sự khác biệt thật sự trong hai quần thể. Vì chúng ta thường khơng lặp lại nghiên cứu, nên chúng ta không biết rằng các kết quả nghiên cứu của chúng ta có phản ánh chính xác sự thật hay là có mắc phải sai lầm. Có hai loại sai lầm khi phiên giải kết quả chúng ta có thể mắc; sai lầm loại I và sai lầm loại II. Khái niệm về sai lầm loại I và sai lầm loại II là tương đương với khái niệm kết quả dương tính giả và âm tính giả trong kiểm định lâm sàng.

Sự thực (quần thể)

Mẫu Các nhóm khác nhau Các nhóm như nhau

Các nhóm khác nhau 9 U (dương tính giả)

Các nhóm như nhau U (âm tính giả) 9

• Nếu chúng ta nói rằng khơng có sự khác biệt trong mẫu nghiên cứu và

quần thể mà mẫu đại diện cũng không có sự khác biệt, chúng ta cũng

khơng có sai lầm trong kết luận.

• Nếu chúng ta đưa ra sự khác biệt trong mẫu nghiên cứu nhưng thực tế

quần thể mà mẫu đại diện lại khơng có sự khác biệt này, chúng ta đã

phạm phải sai lầm loại I

• Nếu chúng ta nói rằng khơng có sự khác biệt trong mẫu nghiên cứu,

nhưng trên thực tế quần thể mà mẫu đại diện lại có sự khác biệt, chúng ta

đa phạm phải sai lầm loại II.

Sai lầm loại I thường được cho là nghiêm trọng hơn sai lầm loại II. Vì khi chúng ta nói rằng có sự khác biệt nhưng trên thực tế kết luận của chúng ta được đưa ra từ một mẫu “tồi” còn tệ hại hơn là đưa ra kết luận là khơng có sự khác biệt. Kết luận này và bảng phía trên có thể được đưa vào phần kiểm định giả thuyết:

H0: Thời gian hồn thành trung bình giữa hai nhóm là như nhau. H1: Thời gian hồn thành trung bình là khác nhau giữa hai nhóm.

Quần thể

Mẫu H1 H0

H1 9 U (Sai lầm loại I)

H0 U ( Sai lầm loại II) 9

Lực của kiểm định là phần bù của sai lầm loại II. Nếu sai lầm loại II là 10%, lực

kiểm định là 90%.

5.2.4. Các mối quan hệ tương hỗ

Một cỡ mẫu được coi là đủ có thể nhỏ hơn 10 người hoặc lớn hơn 100000 người. Cỡ mẫu phụ thuộc vào mục đích của phân tích thống kê là mơ tả hay suy luận, nếu là suy luận thì giả thuyết thống kê được kiểm định, và sự khác nhau tối thiểu có thể nhận thấy

là mối quan tâm của các nhà nghiên cứu, đo lường của biến phụ thuộc và phương sai. Cỡ mẫu tăng khi:

• Độ chính xác yêu cầu của ước lượng tăng.

• Sự khác nhau tối thiểu có thể nhận thấy giảm. • Độ lệch chuẩn tăng

• Sai lầm loại I hoặc sai lầm loại II giảm

• Độ lượng giá trở nên tinh vi hơn (từ liên tục trở thành nhị thức)

Một phần của tài liệu phantichsolieudinhluong2_spss_ytcchanoi_176pages (Trang 146 - 149)

Tải bản đầy đủ (PDF)

(176 trang)