Mục tiêu của bài giảng là giúp sinh viên có thể: Tính khoảng tin cậy của hiệu số hai trung bình, kiểm định giả thuyết hai trung bình là bằng nhau theo phép kiểm t và phép kiểm z, trình bày được các giả định của 2 phép kiểm t và phép kiểm z.
SO SÁNH HAI TRUNG BÌNH - KIỂM ÐỊNH T KHÔNG BẮT CẶP Mục tiêu Sau nghiên cứu chủ đề, học viên có khả Tính khoảng tin cậy hiệu số hai trung bình Kiểm định giả thuyết hai trung bình theo phép kiểm t phép kiểm z Trình bày giả định phép kiểm t phép kiểm z Giới thiệu Trong phần trước nghiên cứu phương pháp suy luận thống kê trung bình biến số định lượng dân số, dựa số liệu từ mẫu ngẫu nhiên trung bình hiệu số trước sau biến số dân số Trên thực tế, thường phải thực việc so sánh trung bình hai dân số sử dụng mẫu không bắt cặp Ðó hai mẫu chọn từ hai dân số khác liên hệ quan sát, chẳng hạn quan sát thứ mẫu liên hệ với quan sát thứ mẫu hai Trong phần nghiên cứu hai phương pháp Tính khoảng tin cậy hiệu số hai trung bình Kiểm định giả thuyết hai trung bình ứng dụng cho hai mẫu không bắt cặp Kí hiệu Chúng ta kí hiệu trung bình độ lệch chuẩn biến số x dân số thứ µ1 σ1 dân số thứ hai µ2 σ2 Hiển nhiên với hai dân số xác định, trung bình µ1, µ2 độ lệch chuẩn dân số σ1 σ2 không đổi Nếu nghiên cứu n1 đối tượng chọn ngẫu nhiên dân số n2 đối tượng chọn ngẫu nhiên dân số 2, tính trung bình x1 độ lệch chuẩn s1 mẫu trung bình x2 độ lệch chuẩn s2 mẫu Dân số Mẫu Dân số Mẫu Trung bình µ1 x1 µ2 x2 Ðộ lệch chuẩn σ1 s1 σ2 s2 Thí dụ Ðể đánh giá liên hệ tình trạng dinh dưỡng tuổi thiếu nhi khả hoạt động thể lực tuổi trưởng thành, nghiên cứu tiến hành làng_ Ở làng, tất bà mẹ mang thai hay cho bú tất trẻ em tuổi bổ sung thực phẩm giàu lượng giàu protein (Atole: 163 KCal + 6,4 g protein/180 mL) làng khác bà mẹ trẻ em bổ sung thực phẩm nghèo lượng protein (Fresco: 59 KCal + g protein/180 mL) Can thiệp dinh dưỡng chấm dứt vào năm 1977 Vào năm 1988, nhà nghiên cứu trở lại làng tiến hành đo đạc tốc độ tiêu thụ oxy cực đại (VO2max) nam niên từ 14 đến 18 tuổi (đây đối tượng bổ sung dinh dưỡng lúc mang thai năm đầu đời) Kết sau Nhóm can thiệp n VO2max (L/phút) Trung bình mẫu Ðộ lệch chuẩn Atole 44 2,62 0,54 Fresco 42 2,24 0,54 Từ số liệu kết luận tốc độ tiêu thụ oxy cực đại hai nhóm can thiệp dinh dưỡng Phân phối mẫu hiệu số hai trung bình Giả sử có dân số P1 gồm nhiều đối tượng bổ sung dinh dưỡng với Atole dân số P2 gồm nhiều đối tượng bổ sung dinh dưỡng với Fresco Giả sử tiến hành nhiều lần việc rút cỡ mẫu gồm 44 nam niên từ dân số P1 42 nam niên từ dân số P2 tính hiệu số trung bình (x1 -x2) Phân phối hiệu số trung bình (x1 -x2) có đặc tính sau thay đổi tuỳ theo giả định chúng ta: a Phương sai dân số Giá trị x1 -x2 thay đổi từ mẫu sang mẫu khác (x1, s1,x2, s2 thay đổi từ mẫu sang mẫu khác) Giá trị x1 -x2 phân phối đối xứng chung quanh giá trị (µ1 - µ2) hiệu số trung bình thực dân số P1 P2: Các giá trị gần (µ1 - µ2) phổ biến giá trị xa với (µ1 - µ2) Sai số chuẩn (x1 -x2) tính theo công thức: SE = σ ( 1 + ) n1 n2 Viết theo ngôn ngữ toán học hình thức X1~N(µ1,σ2) X2~N(µ2,σ2) => (X1 -X2)~(µ1 -µ2 , ) b Phương sai dân số khác Giá trị x1 -x2 thay đổi từ mẫu sang mẫu khác (x1, s1,x2, s2 thay đổi từ mẫu sang mẫu khác) Giá trị x1 -x2 phân phối đối xứng chung quanh giá trị (µ1 - µ2) hiệu số trung bình thực dân số P1 P2: Các giá trị gần (µ1 - µ2) phổ biến giá trị xa với (µ1 - µ2) Sai số chuẩn (x1 -x2) tính theo công thức: SE = ( σ 12 σ 22 + ) n1 n2 Viết theo ngôn ngữ toán học hình thức X1~N(µ1,σ12) X2~N(µ2,σ22) => (X1 -X2)~(µ1 -µ2 , ) Công thức chứng minh sử dụng định lí: phương sai tổng (hay hiệu) biến số độc lập tổng hai phương sai biến số Phương sai (x1 -x2) = Phương sai (x1 ) + Phương sai (x2) = Kiểm định giả thuyết để so sánh hai trung bình Chúng ta muốn kiểm định giả thuyết hai trung bình dân số, µ1 µ2, hay nói khác (µ1 - µ2)=0 Nếu giả thuyết Ho hiệu số trung bình mẫu có phân phối bình thường, tập trung giá trị có sai số chuẩn thay đổi tuỳ theo giả định a Phương sai dân số SE = σ ( 1 + ) n1 n2 Khi đó, Giá trị Z hiệu số trung bình mẫu : ( x − x2 ) ( x1 − x ) Z= = SE 1 σ ( + ) n1 n2 Tuy nhiên thực tiễn xác định σ cách xác, s= (n1 − 1) s12 + (n2 − 1) s 22 (n1 − 1) + (n2 − 1) phải sử dụng t ( x − x2 ) t= = SE để thay cho σ Khi có giá trị ( x1 − x ) s ( 1 + ) n1 n2 với n1+n2-2 độ tự (1) b Phương sai dân số khác SE = ( σ 12 σ 22 + ) n1 n2 Khi đó, Giá trị Z hiệu số trung bình mẫu : ( x − x2 ) ( x1 − x ) Z= = SE σ2 σ2 ( + 2) n1 n2 Cũng tương tự lập luận trên, thực tiễn xác σ1 σ2, nên phải sử dụng s thay cho σ1 s2 thay cho σ2 có giá trị t: ( x − x2 ) ( x1 − x ) t= = SE s2 s2 ( + 2) n1 n (2) s12 s 22 + n1 n d f = 4 s1 s2 + n12 (n1 − 1) n 22 (n2 − 1) với (3) Việc công thức tính độ tự sử dụng giả định phương sai khác tương đối khó nhớ nên độ tự phân phối t phương sai không thường tính toán phần mềm thống Khi phân tích thống kê với máy tính cầm tay, người ta thường giả định cỡ mẫu nhóm 20 độ tự t 30 (xem bảng 1) Khi không cần tra bảng t mà cần tra bảng phân phối chuẩn Do đó, công thức kiểm định t cho trung bình phương sai không với cỡ mẫu lớn gọi công thức kiểm định z Bảng Độ tự t phương sai không tương ứng với phương sai nhóm cỡ mẫu nhóm khác Độ lệch chuẩn nhóm 1: s1 1 2 Cỡ mẫu nhóm 1: n1 10 20 20 10 20 20 Độ lệch chuẩn nhóm 2: s2 1 1 1 Cỡ mẫu nhóm 2: n2 10 10 20 10 10 20 Độ tự 18 18 38 13 28 28 Tóm lại, có công thức để kiểm định trung bình: công thức (1) công thức (2) Cả hai công thức sử dụng biến số cần so sánh có phân phối bình thường Tuy nhiên công thức (1) sử dụng giả định phương sai công thức (2) đơn giản để sử dụng cỡ mẫu nhóm lớn Trong trường hợp phương sai không nhau, sử dụng công thức (2) tính toán cụ thể độ tự theo công thức (3) Thí dụ tính toán kiểm định so sánh trung bình Trong thí dụ so sánh tốc độ sử dụng oxy cực đại hai nhóm niên, giả thuyết Ho đưa Ho: trung bình tốc độ sử dụng oxy cực đại nhóm Atole trung bình tốc độ sử dụng oxy cực đại nhóm Fresco µA = µF Bởi hai giả định (a) phương sai (b) cỡ mẫu nhóm lớn đúng, chọn sử dụng phương pháp kiểm định trên: 2a Kiểm định sử dụng giả định phương sai 3a Tính giá trị thống kê s= ( n1 − 1) s12 + ( n2 − 1) s 22 = (n1 − 1) + ( n2 − 1) 43 × 0,54 + 41 × 0,54 = 0,54 (44 − 1) + (42 − 1) ( x1 − x2 ) 2,62 − 2,24 0,38 = = = 0,326 với 84 độ tự 0,1165 1 1 s ( + ) 0,54 + 4a Vì độ tự lớn nên chúng n1 n2 44 42 ta tra bảng phân phối chuẩn z thay cho bảng t Ta có P(|Z|≥3,26)=0,0012 Nếu tính trực tiếp p, tra bảng biết p 0,001 5a Khi bác bỏ Ho với p=0,0011, hay nói khác số liệu cho phép kết luận can thiệp dinh dưỡng Atole tuổi nhà trẻ làm tăng tốc độ sử dụng oxy tối đa tuổi trưởng thành (p=0,0011) t= 2b Kiểm định sử dụng giả định phương sai không 3b Tính giá trị thống kê ( x − x2 ) ( x1 − x ) (2,62 − 2,24) 0,38 t= = = )= = 3,26 2 SE 0,1165 0,01357 σ1 σ ( + ) n1 n2 cỡ mẫu nhóm lớn cho độ tự t lớn tra bảng phân phối chuẩn z thay cho bảng t Nếu muốn chặt chẽ sử dụng cong thức trình bày để tính độ tự phân phối t 83,8 4b Tính giá trị p: P(|Z|≥3,26)=0,0012 5b Kết luận: Chúng ta bác bỏ Ho với p=0,0011, hay nói khác số liệu cho phép kết luận can thiệp dinh dưỡng Atole tuổi nhà trẻ làm tăng tốc độ sử dụng oxy tối đa tuổi trưởng thành (p=0,0012) Ðiều kiện sử dụng test Z Test Z trình bày đòi hỏi giả định: Phân phối mẫu trung bình mẫu phân phối mẫu hiệu số trung bình mẫu có phân phối xấp xỉ bình thường Ðộ lệch chuẩn thực (độ lệch chuẩn dân số) σ1 σ2 ước lượng cách xác độ lệch chuẩn mẫu s1 s2 Chính xác ra, giả định thứ giá trị số liệu dân số có phân phối bình thường Tuy nhiên theo định lí giới hạn trung tâm, với cỡ mẫu lớn phân phối trung bình mẫu tiệm cận phân phối bình thường giá trị số liệu dân số phân phối bình thường Về giả định thứ hai, s1 s2 ước lượng xác σ1 σ2 cỡ mẫu lớn Vì vậy, phương pháp z nói chung đáng tin cậy cỡ mẫu đủ lớn (cỡ mẫu nhóm từ 20 trở lên) hình dạng tổ chức đồ không không bình thường Ngoài phân tích tổ chức đồ thấy phân phối bị lệch dương, cần phải dùng biến đổi log để phân phối trở lại gần giống phân phối bình thường 8 Phương pháp với mẫu nhỏ Nếu haimẫu nhỏ, hai giả định nêu bị vi phạm sử dụng xấp xỉ bình thường không đáng tin cậy Tuy nhiên phân tích tổ chức đồ cho thấy giá trị tương đối đối xứng không khác biệt với phân phối bình thường, sử dụng phương pháp biến cải từ phép kiểm định z nêu Ðó sử dụng phân phối t chấp nhận sai số thêm vào sử dụng độ lệch chuẩn mẫu s1 s2 thay độ lệch chuẩn thực σ1 σ2 Tuy nhiên phương pháp đòi hỏi thêm giả định hai độ lệch chuẩn thực σ1 σ2 với giá trị chung σ Vì phương pháp đòi hỏi hai độ lệch chuẩn không khác (tỉ số chúng không lớn 2) Công thức kiểm định t tương tự kiểm định z khác công thức sai số chuẩn: SE = s ( 1 + ) n1 n2 vôùi s = (n1 − 1) s12 + (n − 1) s 22 (n1 − 1) + (n − 1) Trong công thức s ước lượng độ lệch chuẩn chung σ gọi độ lệch chuẩn gộp (pooled standard deviation) trung bình hai độ lệch chuẩn s1 s2 với hệ số mẫu số công thức tính độ lệch chuẩn Ðể kiểm định ý nghĩa thống kê người ta tính giá trị t ( x − x2 ) ( x1 − x ) t= = SE 1 s ( + ) n1 n vôùi s = (n1 − 1) s12 + (n2 − 1) s 22 (n1 − 1) + (n2 − 1) tính P(|t|>to) cách sử dụng phần mềm máy tính hay tra bảng phân phối student với (n1+n2-2) độ tự Trong trường hợp người ta gọi test t không bắt cặp Ðể tính khoảng tin cậy hiệu số (µ1 - µ2) thống kê t ta sử dụng công thức: ( x1 − x ) ± t × s ( 1 + ) n1 n2 giá trị t tra từ bảng phân phối student So sánh kiểm định z kiểm định t Kiểm định z kiểm định t hoàn toàn tương đương thống kê biến số định lượng Như sử dụng thống kê z hay t ước lượng khoảng tin cậy trung bình, hiệu số trung bình, kiểm định ý nghĩa so sánh trung bình thiết kế có bắt cặp không bắt cặp Chúng khác điều kiện áp dụng Ðiều kiện áp dụng thống kê z cỡ mẫu đủ lớn (để trung bình mẫu có phân phối bình thường độ lệch chuẩn mẫu gần độ lệch chuẩn dân số) Ðiều kiện áp dụng thống kê t phân phối giá trị phải xấp xỉ bình thường (trong trường hợp so sánh mẫu cần thêm điều kiện hai độ lệch chuẩn mẫu không khác nhau) Khi áp dụng thống kê z hay thống kê t, thí dụ cỡ mẫu nhỏ phân phối không bình thường hai phương sai không đồng ta cần phải sử dụng phép kiểm phi tham số Khoảng tin cậy hiệu số hai trung bình Sử dụng lập luận trình bày cho việc tính khoảng tin cậy trung bình tỉ lệ đơn, có công thức khoảng tin cậy 95% hiệu số (µ1 - µ2) tuỳ theo giả định: a Giả định phương sai nhóm Ðể tính khoảng tin cậy hiệu số (µ1 - µ2) thống kê t ta sử dụng công thức: ( x1 − x ) ± t c × s ( s= với 1 + ) n1 n2 với tc giá trị tới hạn phân phối t n1+n2- độ tự (n1 − 1) s12 + (n2 − 1) s 22 (n1 − 1) + (n2 − 1) b Giả định phương sai nhóm không Khoảng tin cậy hiệu số (µ1 - µ2) phương sai nhóm không tính theo công thức: ( x1 − x ) ± t c × ( s12 s 22 + ) n1 n2 với tc giá trị tới hạn phân phối t với độ tự s12 s 22 + n1 n d f = 4 s1 s2 + n12 (n1 − 1) n 22 (n2 − 1) Khi cỡ mẫu đủ lớn không cần phải tính độ tự (bởi độ tự lớn) mà cần áp dụng giá trị tới hạn z thay cho giá trị tới hạn t Áp dụng nghiên cứu can thiệp dinh dưỡng lên khả hoạt động thể lực, khoảng tin cậy 95% VO2max là: s12 s 22 0,54 0,54 ( x1 − x ) ± 1,96 × ( + ) = (2,62 − 2,24) ± 1,96 × ( + ) n1 n2 44 42 0,54 0,54 = 0,38 ± 1,96 × ( + ) = 0,38 ± 0,23 = 0,15 ñeán 0,61L / 44 42 Khoảng tin cậy 95% có ý nghĩa: Xác suất hiệu số trung bình tốc độ oxy tối đa nam niên can thiệp dinh dưỡng Atole nhóm can thiệp Fresco nằm khoảng 0,38 đến 0,61 lít/phút 95% Bài tập Mẫu gồm 143 trẻ gái 127 trẻ trai tuổi từ 1-4 tuổi chọn từ ngẫu nhiên từ dân số nông thôn Mức Hemoglobin (Hb) tính g/dL đứa trẻ đo lường cho kết sau: Giới tính n Hemoglobin (g/dL) Trung bình mẫu Ðộ lệch chuẩn Nam 143 11,35 1,41 Nữ 127 11,01 1,32 a Hiệu số quan sát trung bình nồng độ Hb trẻ em nam trẻ em nữ? Nếu không làm kiểm định thống kê, có cho có khác biệt nồng độ Hb theo giới tính dân số không? b Ước lượng sai số chuẩn hiệu số hai trung bình mẫu Nó có ý nghĩa gì? Vẽ phác phân phối mẫu hiệu số trung bình c Sử dụng sai số chuẩn tính để tính khoảng tin cậy 95% cho hiệu số thực trẻ em nam trẻ em nữ Chúng ta kết luận từ điều này? d muốn có sức mạnh chứng cho khác biệt hai giới, làm gì? e Tiến hành kiểm định ý nghĩa tính giá trị p Giả thuyết không gì? Giá trị p lí giải nào? f Tính khoảng tin cậy 95% Hb trung bình trẻ nam trẻ nữ Hai khoảng tin cậy có trùng không? Thảo luận g Chúng ta có cần kiểm định t phân tích hay không? Trong thử nghiệm cộng đồng sử dụng Ivermectin để điều trị nhiễm onchocercam, dân làng từ tuổi trở lên dùng Ivermectin hay viên placebo Trước điều trị, thể tích hồng cầu đặc (packed cell volume - PCV) đo hai nhóm Sáu tháng sau điều trị, thể tích hồng cầu đặc đo số liệu đàn ông từ 25-29 tuổi trình bày bảng sau: Ivermectin (n=16) 39 - 35 - 38 - 42 - 37 - 52 - 40 - 45 - 39 - 31 - 34 - 45 - 44 - 42 - 40 43 Placebo (n=14) 40 - 41 - 35 - 36 - 32 - 38 - 38 - 44 - 43 - 46 - 33 - 35 - 31 - 33 a Tính trung bình độ lệch chuẩn PCV nhóm Hiệu số quan sát trung bình PCV hai nhóm Nếu không làm kiểm định thống kê, có cho có khác biệt PCV hai nhóm can thiệp placebo hay không? b Kiểm định ý nghĩa cần thiết để đánh giá hiệu số hai trung bình? c Ðiều kiện để kiểm định có giá trị gì? Ðiều kiện có thoả trường hợp hay không? d Kiểm định thống kê tính giá trị p Lí giải giá trị p e Tính khoảng tin cậy 95% hiệu số PCV trung bình nhóm ivermectin nhóm placebo f Từ số liệu rút kết luận gì? Người ta đếm số lượng cung quăng 100 ml nước hồ nước bảy ngày liên tiếp tháng mười 10 ngày liên tiếp tháng mười Kết trình bày bảng sau: Tháng mười Tháng 25 mười 41 10 22 36 14 2 13 10 a Tính trung bình độ lệch chuẩn số lượng lăng quăng bắt tháng b Kiểm định t có thích hợp để so sánh khác biệt hai tháng hay không? c Lấy logarithm số lượng cung quăng, lúc kiểm định t có thích hợp không? có tiến hành kiểm định lí giải kết d tính khoảng tin cậy hiệu số trung bình (vẫn sử dụng thang đo log) e Lấy antilog hiệu số quan sát trung bình log, lí giải ý nghĩa số Lấy antilog k Một bệnh viện so sánh nằm viện trung bình hai nhóm bệnh nhân: nhóm bao gồm bệnh nhân bác sĩ (chưa đạo tạo sau đại học) điều trị nhóm bác sĩ có sau đại học điều trị Kết sau: n1 = 1820; x1 = 12,6; s1= n2 = 1250; x2 = 12,3; s2= Kiểm định sử dụng để so sánh thời gian nằm viện trung bình hai nhóm bệnh nhân Kiểm định thống kê tính giá trị p Lí giải giá trị p Từ số liệu rút kết luận gì? ... t tra t bảng phân phối student So sánh kiểm định z kiểm định t Kiểm định z kiểm định t hoàn toàn t ơng đương thống kê biến số định lượng Như sử dụng thống kê z hay t ước lượng khoảng tin c y. .. để so sánh hai trung bình Chúng ta muốn kiểm định giả thuy t hai trung bình dân số, µ1 µ2, hay nói khác (µ1 - µ2)=0 Nếu giả thuy t Ho hiệu số trung bình mẫu có phân phối bình thường, t p trung. .. c y trung bình, hiệu số trung bình, kiểm định ý nghĩa so sánh trung bình thi t kế có b t cặp không b t cặp Chúng khác điều kiện áp dụng Ðiều kiện áp dụng thống kê z cỡ mẫu đủ lớn (để trung bình