CHƯƠNG 7 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
7.6. Kiểm định sự độc lập hay phụ thuộc của các phân phối
Gọi M là một mẫu thuộc dân số D có n cá thể. Trong M, giả sử đặc tính X và đặc tính Y được khảo sát, trong đó đặc tính Xcó k loại A1, A2, …, Ak và đặc tính Y có t loại B1, B2, …, Bt
có tần số thực nghiệm tương ứng được cho trong bảng sau:
X
Y A1 A2 … Ak cộng
B1 n11 n12 … n1k m1
B2 n21 n22 … n2k m2
… … … …
Bt nt1 nt2 … ntk mt
cộng a1 a2 … ak n
Vấn đề đặt ra là đặc tính X và Y trong dân số D có phụ thuộc hay không, ngưỡng sai lầm ? Chú ý: Điều kiện để áp dụng tiêu chuẩn phù hợp 2 theo K.Pearson là các tần số quan sát
5
ij
n . Nếu các nij quá nhỏ phải ghép các giá trị hay các khoảng giá trị lại để tăng nij lên.
Cách thực hiện:
1. Đặt giả thuyết H: Không có sự phụ thuộc giữa X và Y trong dân số D 2. Tính các phân phối lý thuyết n/i1, n/i2, …, n/ik với i=1,2,…,t
Ta có:
k loại
mẫu A1 A2 … Ak cộng
B1 n11 n12 … n1k m1
B2 n21 n22 … n2k m2
… … … …
Bt nt1 nt2 … ntk mt
cộng a1 a2 … ak n
Khi đó, tần số lý thuyết n được tính như sau: /ij n/ij m .ai j; i 1,2,..., t; j 1,2,...,k
n
3. Tính t k ij / / 2ij
i 1 j 1 ij
(n n )
Q n
4. Nếu Q 2( ) bác bỏ H. Ngược lại, Q 2( ) chấp nhận H
với là ngưỡng sai lầm; là độ tự do của 2(trong đó (t 1)(k 1) ) Ví dụ 7.20: Quan sát 124 người về màu mắt và màu tóc, kết quả như sau:
màu tóc
màu mắt Vàng hoe Nâu Đen Vàng đỏ cộng
Xanh 25 9 3 7 44
Xám lục 13 17 10 7 47
Nâu mận 7 13 8 5 33
cộng 45 39 21 19 124
Có sự phụ thuộc giữa màu mắt và màu tóc con người không? ( = 0,05) Giải:
1. Đặt giả thuyết H: Không có sự phụ thuộc giữa màu mắt và màu tóc con người 2. Tính tần số lý thuyết n /ij
màu tóc
màu mắt Vàng hoe Nâu Đen Vàng đỏ cộng
Xanh 15,96 13,85 7,46 6,75 44
Xám lục 17,06 14,79 7,96 7,19 47
Nâu mận 11,98 10,36 5,58 5,06 33
cộng 45 39 21 19 124
3. Ta có t k ij / / 2ij
i 1 j 1 ij
(n n )
Q 15
n
4. Vì Q 19,4 20,05( (3 1)(4 1) 6) 12,6 bác bỏ H
Vậy có sự phụ thuộc giữa màu mắt và màu tóc con người, ngưỡng sai lầm = 0,05.
Ví dụ 7.21: Quan sát 1500 người về nhóm máu và mức độ bị bệnh X, kết quả như sau:
nhóm máu
bệnh X A B AB O cộng
không có 543 211 90 476 1320
nhẹ 44 22 8 31 105
nặng 28 9 7 31 75
cộng 615 242 105 538 1500
Có sự phụ thuộc giữa nhóm máu và bệnh X không? ( = 0,05) Giải:
1. Đặt giả thuyết H: Không có sự phụ thuộc giữa nhóm máu và bệnh X 2. Tính tần số lý thuyết n /ij
nhóm máu
bệnh X A B AB O cộng
không có 541,2 211,9 92,4 473,5 1320
nhẹ 43,1 16,9 7,4 37,7 105
nặng 30,7 12,1 5,2 26,9 75
cộng 615 242 105 538 1500
3. Ta có t k ij / / 2ij
i 1 j 1 ij
(n n )
Q 5,12
n
4. Vì Q 5,12 20,05( (3 1)(4 1) 6) 12,6 chấp nhận H
Vậy không có sự phụ thuộc giữa màu mắt và màu tóc con người, ngưỡng sai lầm = 0,05.
BÀI TẬP CHƯƠNG 7
Bài 7.1. Khám ngẫu nhiên 200 người có 15 người mắc bệnh K phổi. Hỏi quan sát này có phù hợp với tỷ lệ bệnh K phổi trong cộng đồng là 7% không?
Bài 7.2. Tỉ lệ mắc bệnh B ở một địa phương là 4%. Trong một lần kiểm tra sức khỏe ngẫu nhiên cho 300 người thấy có 24 người mắc bệnh B. Với mức ý nghĩa 5%, có thể cho rằng tỉ lệ người bệnh B có xu hướng tăng lên không?
Bài 7.3. Bệnh B gây tử vong 20%. Dùng phương pháp A điều trị ngẫu nhiên 200 người, có 29 người tử vong. Với số liệu này có đủ kết luận phương pháp A có hiệu quả không với mức ý nghĩa 5%?
Bài 7.4. Người ta muốn xem xét Aspirin có ảnh hưởng đến bị huyết khối khi thay van tim hay không? Chọn ngẫu nhiên 188 bệnh nhân sau khi thay van tim, cho dùng 100 mg Aspirin/ngày trong 4 năm liền, kết quả có 21 người bị huyết khối? Số liệu trên có phù hợp với kết quả: có khoảng 12% người bị huyết khối khi thay van tim trong vòng 4 năm không?
Bài 7.5. Trong một dây chuyền sản xuất có 20% viên không đạt chuẩn. Một cải tiến được thực hiện và sản xuất thử 200 viên thì có 25 viên không đạt chuẩn?
a) Việc cải tiến trên có làm thay đổi tỷ lệ viên thuốc không đạt chuẩn hay không với mức ý nghĩa 5%?
b) Với mức ý nghĩa 1%, việc cải tiến có làm tăng tỷ lệ viên thuốc đạt chuẩn hay không?
Bài 7.6. Một phương pháp chiết suất dược liệu cho trung bình 150 (gam cao/1 kg dược liệu) và độ lệch chuẩn 20 (gam cao/1 kg dược liệu). Một cải tiến được thực hiện, sau khi chiết xuất 30 lần, tính được trung bình mẫu 160 (gam cao/1 kg dược liệu). Kết luận cải tiến trên với mức ý nghĩa 5%?
Bài 7.7. Một bệnh viện đang tiến hành thử nghiệm hai phương pháp mới trong việc điều trị bệnh B.
Người ta tiến hành 1200 bệnh nhân bệnh B theo hai phương pháp: Phương pháp A điều trị 500 bệnh nhân bệnh B thì thấy có 425 bệnh nhân khỏi bệnh, phương pháp B điều trị 700 bệnh nhân bệnh B thì thấy có 616 bệnh nhân khỏi bệnh. Hãy so sánh hiệu quả của hai phương pháp điều trị trên với mức ý nghĩa 1%?
Bài 7.8. Năng suất lúa trung bình của vụ trước là 45 tạ / ha. Vụ lúa năm nay, người ta áp dụng biện pháp kỹ thuật mới cho toàn bộ diện tích trồng lúa trong vùng. Theo dõi năng suất lúa ở 100 ha, ta có bảng số liệu sau:
a) Hãy cho kết luận về biện pháp kỹ thuật mới này với độ tin cậy 95%?
b) Năng suất lúa trung bình từ 55 tạ / ha thì được xếp vào lúa loại I. Năng suất trung bình của lúa loại I năm trước là 63 tạ / ha. Người ta công bố sau khi áp dụng biện pháp kỹ thuật mới, năng suất lúa loại 1 cao hơn 63 tạ / ha có chấp nhận được không với mức ý nghĩa 1%? (Giả thuyết năng suất lúa trong vùng là biến ngẫu nhiên có phân phối chuẩn)
Năng suất (tạ / ha)
Diện tích (ha)
35 7
35 - 40 12
40 - 45 18
45 - 50 27
50 - 55 20
55 - 60 8
60 - 65 5
> 65 3
cộng 100
c) Một tài liệu cho rằng: tỷ lệ lúa loại I của vùng cao hơn 20%. Với mức ý nghĩa 1%, nhận xét tài liệu trên?
Bài 7.9. Khảo sát trọng lượng trung bình của con so và con rạ. Người ta cân 95 con so và tính được
12,798 ; 10,436
x kg s kg; cân 105 con rạ và tính được x2 3,166 ;kg s10,469kg. Kết luận trọng lượng trung bình của con so và con rạ với mức ý nghĩa 1%?
Bài 7.10. Đánh giá tác dụng của thuốc X đối với số hồng cầu của bệnh nhân, người ta tiến hành quan sát số hồng cầu của người bệnh trước và sau khi uống thuốc X, kết quả cho trong bảng sau:
Trước 45 36 47 40 45 35 36 50 50 40 40 30 45 30 45 40 50 40 50 55 Sau 48 40 53 40 45 30 40 60 50 40 40 35 50 40 60 45 50 40 45 50 Có ý kiến cho rằng số hồng cầu của người bệnh tăng lên sau khi uống thuốc X. Nhận xét ý kiến
trên với mức ý nghĩa 1%?
Bài 7.11. Điều tra lượng cholesterol toàn phần trong huyết thanh của 25 bệnh nhân bị bệnh X và tính được trung bình mẫu là 172mg với độ lệch chuẩn mẫu là 40mg. Biết rằng lượng cholesterol toàn phần của người bình thường là 156mg. Kết luận lượng cholesterol toàn phần trong huyết thanh của bệnh nhân bị bệnh X với mức ý nghĩa 5%?
Bài 7.12. So sánh độ tăng trọng của hai loại thuốc bổ A và B, người ta tiến hành chọn hai nhóm để thử hai loại thuốc bổ A, B trong 3 tháng. Kết quả cho trong bảng sau:
Nhóm uống thuốc A 5 4 2 1 4
Nhóm uống thuốc B 6 5 4 2 6 4 5
Kết luận về độ tăng trọng của hai loại thuốc bổ A, B với mức ý nghĩa 1%?
Bài 7.13. Nghiên cứu độ tăng lực của chuột sau khi uống thuốc X. Người ta cho chuột leo cây cho đến khi kiệt sức, thời gian tính bằng phút.
Chuột trước khi uống thuốc X 34 36 30 24 40 44 50 Chuột sau khi uống thuốc X 46 56 28 34 56 64 70 Kết luận về độ tăng lực của chuột sau khi uống thuốc X với mức ý nghĩa 5%?
Bài 7.14. Được biết nhịp mạch trung bình của nam thanh niên là 72 lần/phút. Kiểm tra 64 thanh niên làm việc trong hầm lò thấy nhịp mạch trung bình là 74 lần/phút và s= 9 lần/phút. Hãy xét xem làm việc trong hầm lò có làm tăng nhịp mạch hay không với mức ý nghĩa 1%?
Bài 7.15. Biết chiều cao trung bình của thanh niên địa phương A là biến ngẫu nhiên có phân phối chuẩn với trung bình = 1,60 (m). Tiến hành đo ngẫu nhiên 80 người ở địa phương A, tính được trung bình x1,64 (m) và s = 0,3 (m). Với mức ý nghĩa = 5%, cho biết kết quả này có phù hợp với giá trị cho biết không?
Bài 7.16. Một nhà máy sản xuất với tỉ lệ sản phẩm loại A lúc đầu là 20%. Sau khi áp dụng phương pháp sản xuất mới, nhà máy tiến hành kiểm tra 500 sản phẩm thì thấy có 150 sản phẩm loại A.
a) Hãy cho biết hiệu quả của phương pháp mới này với mức ý nghĩa 5%?
b) Nếu nhà máy kết luận tỉ lệ sản phẩm loại A của họ sau khi áp dụng phương pháp mới là 25%
với độ tin cậy 98% có chấp nhận được không ?
Bài 7.17. Đường kính của một chi tiết máy được gọi là đạt yêu cầu kỹ thuật khi phương sai đường kính không vượt quá 1mm2. Người ta chọn ra một mẫu ngẫu nhiên 25 chi tiết máy và tính được phương sai đường kính trên mẫu là 1,38mm2. Với mức ý nghĩa 5%, có thể kết luận gì về quá trình sản xuất chi tiết máy? (Giả thiết chiều dài của chi tiết máy là biến ngẫu nhiên có phân phối chuẩn)
Bài 7.18. Một nhà máy tiện tự động quy định phương sai của đường kính trục máy bằng
2 36cm2
, biết rằng đường kính trục máy của nhà máy là biến ngẫu nhiên có phân phối chuẩn.
Người ta tiến hành quan sát 25 đường kính của trục máy và tính được s2 35,266cm2. Với mức ý nghĩa 5%, hãy cho biết kết luận về quá trình sản xuất?
Bài 7.19. Để so sánh trọng lượng trung bình của trẻ sơ sinh thành thị và nông thôn, người ta tiến hành theo dõi 4000 trẻ sơ sinh ở nông thôn và tính được trung bình x1 3,0(kg) với độ lệch chuẩn mẫu s10,9(kg); theo dõi 6000 trẻ sơ sinh ở thành thị và tính được trung bình
2 3,2
x (kg) với độ lệch chuẩn mẫu s2 0,4(kg). Với mức ý nghĩa 5%, có thể xem trọng lượng trung bình trẻ sơ sinh ở thành thị cao hơn nông thôn được không? Giả thiết trọng lượng trung bình của trẻ sơ sinh là biến ngẫu nhiên có phân phối chuẩn.
Bài 7.20. Để kiểm tra độ chính xác của 2 chiếc máy tiện, người ta chọn ngẫu nhiên 10 chiếc trục được tiện từ máy 1 và thấy phương sai đường kính trục là 25, và chọn ngẫu nhiên 12 chiếc trục được tiện từ máy 2 và thấy phương sai đường kính trục là 18. Với mức ý nghĩa 1% có thể kết luận độ chính xác của 2 máy như nhau không?
Bài 7.21. Quan sát trọng lượng (kg) của một nhóm 100 em trai ở 16 tuổi ở 1 địa phương có kết quả sau:
Trọng lượng X (kg) 40 40 - 45 45 - 50 50 - 55 55 - 60 60 - 65 > 65
Số người 8 11 18 23 20 11 9
Trọng lượng X của các em trai ở địa phương trên có phân phối chuẩn không? ( = 0,05)