KHÁC BIỆT GIỮA CÁC TRUNG VỊ

Một phần của tài liệu Bài 6 so sánh 2 nhóm (Trang 26 - 30)

Nhớ lại rằng trung vị là một thước đo của xu hướng trung tâm với một nửa các quan sát nhỏ hơn nó và một nửa các quan sát lớn hơn nó.

27

6.1. THỐNG KÊ KIỂM NGHIỆM SỰ KHÁC BIỆT CỦA HAI TRUNG VỊ

Người ta có thể kiểm nghiệm giả thuyết khống cho rằng hai mẫu đến từ các quần thể có cùng trung vị bằng kiểm nghiệm trung vị (Mood, 1950. Introduction to the Theory of Statistics (Giới thiệu về Lí thuyết Thống kê), McGraw−Hill, New York, trang 394−395). Thủ tục này là phải thiết lập một bảng như trong ví dụ sau đây, và sau đó áp dụng kiểm nghiệm Chi−bình phương hay kiểm nghiệm chính xác Fisher.

Ví dụ 9: Số liệu về dao động cơ thể được thu thập cho hai mẫu của các đối tượng, số các đối tượng cao hơn hoặc thấp hơn trung vị như sau:

Số lượng Mẫu 1 Mẫu 2 Tổng

Trên trung vị 3 8 11

Không trên trung vị 6 6 12

Tổng 9 14 23

Thống kê Chi bình phương χ2 = 1,24461 thấp hơn giá trị mong đợi 5,024 (với 1 df, mức ý nghĩa 5%), chúng ta kết luận rằng các trung vị của hai mẫu là tương đương.

Kết luận này là phù hợp với kiểm nghiệm chính xác Fisher (sẽ giới thiệu ở phần tiếp theo).

12 11 9 14

23 3 6 8 6 0 18657

6.2. KHOẢNG TIN CẬY CHO TRUNG VỊ

Để tìm khoảng tin cậy cho trung vị quần thể, trước tiên chúng ta cần tính các đại lượng sau:

2 2 2 1 2

trong đó n là cỡ mẫu; là giá trị z từ phân bố bình thường chuẩn tương ứng với mức ý nghĩa α. Sau đó làm trịn r và s tới các số nguyên gần nhất. n quan sát mẫu cần phải được

1 Giá trị này tính bằng cơng thức sau:

, trong đó Oij là giá trị quan sát (ở ơ i,j trong bảng trên) và Eij là giá trị mong đợi tương ứng cho bởi công thức Eij = Tổng hàng i × Tổng cột j / Tổng tồn phần ( ví dụ trong ví dụ trên E12= 11 × 14 / 23 = 6,696). Lưu ý rằng các số liệu ghi trong các ô bị ràng buộc bởi tổng hàng, tổng cột và tổng toàn phần nên số bậc tự do = (số hàng -1)×(số cột -1)

28

xếp hạng tăng dần theo độ lớn và quan sát thứ r và thứ s trong bảng xếp hạng xác định KTC cho trung vị của quần thể. Xấp xỉ này là thỏa đáng cho hầu hết các cỡ mẫu. Người ta có thể sử dụng phương pháp chính xác dựa trên phân bố nhị thức thay cho phương pháp này như trong ví dụ 10 (b) dưới đây.

Ví dụ 10:

(a) Giả sử rằng trung vị các áp huyết tâm thu BA trong số 100 bệnh nhân là 146 mmHg. Sử dụng cơng thức trên chúng ta có: 100 2 1 96 100 2 ≅ 40 100 2 1 1 96 100 2 ≅ 61

Từ dữ liệu gốc, theo thứ tự tăng dần quan sát thứ 40 là 142 mmHg và thứ 61 là 150 mmHg. Do đó, KTC 95% cho trung vị quần thể là từ 142 mmHg đến 150 mmHg. / /

(b) Ví dụ về mẫu nhỏ sử dụng phân bố nhị thức: Các kết quả của nghiên cứu đo nồng độ endorphin β (tính bằng pmol/l) ở 11 chủ thể bị ngất xỉu khi chạy đua marathon xếp theo thứ tự tăng dần như sau: 66,0; 71,2; 83,0;, 83;6; 101,0; 107,6;122,0; 143,0; 160,0; 177,0 và 414,0.

Trung vị mẫu là quan sát thứ 6 (107,6 pmol/l). Để tìm KTC của trung vị quần thể chúng ta dung phân bố nhị thức với p = 0,5. Cho KTC 95% dè dặt, trước hết chúng ta tìm xác suất tích luỹ lớn nhất cịn nhỏ hơn 0,025 và xác suất tích luỹ nhỏ nhất lớn hơn 0,975 bằng cách tính tốn trực tiếp hay dùng bảng. Với n = 11, điều này cho P X ≤ 1 0 006 và P X ≤ 9 0,994. Theo đó KTC 95% xấp xỉ được suy từ các quan sát có thứ tự lớn hơn 1 tương ứng với hai xác suất này tức là quan sát thứ 2 và thứ 10, tức là 71,2 và 177,0 pmol/l. Xác suất đúng liên kết với KTC này là 0,994 – 0,006 = 0,988 nên thực tế đó là KTC 99,8%.

Một cách khác tìm khoảng tin cậy 95% dè dặt là tìm xác suất tích luỹ nhỏ nhất trên 0,025 và xác suất tích luỹ lớn nhất dưới 0,975. Trong trường hợp này P X ≤ 2) = 0,033 và P X ≤ 8) = 0,967, từ đó được KTC 93,4% từ quan sát thứ 3 tới quan sát thứ 9 (83,0 đến 160 pmol/l). Độ tin cậy chính xác liên kết với một KTC xấp xỉ cụ thể nào đều có thể tính được từ phân bố của thống kê sử dụng.

6.3. KHOẢNG TIN CẬY CHO HIỆU HAI TRUNG VỊ

Cho x1, x2,,. . . , xn biểu thị cho n quan sát trong một mẫu từ một quần thể và y1, y2,. . . , ym là m quan sát từ một quần thể thứ hai, trong đó cả hai được cho là khơng lấy từ một quần thể bình thường. Hiệu giữa hai trung vị hay hai trung bình quần thể được ước lượng bằng trung vị của tất cả m × n các hiệu có thể có được (xi −yj ) với i = 1, ... , n và j = 1, ... , m.

29

Đối với các nghiên cứu với cỡ mẫu nhỏ, các KTC được tính tốn dựa trên thống kê sau đây:

1 2

trong đó Wα/2 là phần trăm thứ 100 α 2 trong phân bố của thống kê kiểm nghiệm

Mann−Whitney hoặc của thống kê kiểm nghiệm tương đương Wilcoxon với hai mẫu . Phần trăm thứ K nhỏ nhất và phần trăm thứ K lớn nhất (tính từ trung vị) của m × n hiệu trên xác định KTC yêu cầu. Các giá trị của K cho m và n cho sẵn được cho trong Phụ lục 2.

Đối với các nghiên cứu với cỡ mẫu > 20, chúng ta có thể tính tốn KTC như sau:

2

1 12

làm trịn đến số ngun kế tiếp trong đó N là giá trị thích hợp từ phân bố bình thường chuẩn (chẳng hạn là là 1,96 cho KTC 95%).

Ví dụ 11: Xét dữ liệu về tỉ lệ globulin trong huyết tương (g/l) ở hai nhóm với 10 bệnh nhân như sau:

Nhóm 1: 38 26 29 41 36 31 32 30 35 33 Nhóm 2: 45 28 27 38 40 42 39 39 34 45 Các tính tốn được thực hiện dễ dàng hơn nếu trước hết xếp dữ liệu trong mỗi nhóm theo thứ tự tăng dân về độ lớn độ và sau đó mới tính tất cả các hiệu có thể có cho nhóm 1 − nhóm 2 như trong bảng sau đây:

Nhóm 1 26 29 30 31 32 33 35 36 38 41 N m 2 27 -1 2 3 4 5 6 8 9 11 14 28 -2 1 2 3 4 5 7 8 10 13 34 -8 -5 -4 -3 -2 -1 1 2 4 7 35 -9 -6 -5 -4 -3 -2 0 1 3 6 39 -13 -10 -9 -8 -7 -6 -4 -3 -1 2 39 -13 -10 -9 -8 -7 -6 -4 -3 -1 2 40 -14 -11 -10 -9 -8 -7 -5 -4 -2 1 42 -16 -13 -12 -11 -10 -9 -7 -6 -4 -1 45 -19 -16 -15 -14 -13 -12 -10 -9 -7 -4 45 -19 -16 -15 -14 -13 -12 -10 -9 -7 -4

Ước lượng của hiệu hai trung vị quần thể bây giờ được cho bởi trung vị của các hiệu này. Trung vị của 100 hiệu trong bảng trên là −4,5 g/l.

30

Để tính KTC 95% cho hiệu hai trung vị quần thể, giá trị của K được tìm ra là 24 đối với n = 10 và m = 10. Phần trăm thứ 24 nhỏ nhất tính từ trung vị (phần trăm thứ 26 của mẫu) là −9,26 g/l và phần trăm thứ 24 lớn nhất tính từ trung vị (phần trăm thứ 74 của mẫu) là 1 g/l. Do đó, KTC 95% cho hiệu của hai trung vị quần thể là từ -9,26 g/l đến 1 g/l. / /

Một phần của tài liệu Bài 6 so sánh 2 nhóm (Trang 26 - 30)

Tải bản đầy đủ (PDF)

(56 trang)