Kiểm định sự độc lập hay phụ thuộc của các phân phối

Một phần của tài liệu XÁC SUẤT THỐNG kê y dược (Trang 147)

Gọi M là một mẫu thuộc dân số D cĩ n cá thể. Trong M, giả sử đặc tính X và đặc tính Y được khảo sát, trong đĩ đặc tính X cĩ k loại A1, A2, …, Ak và đặc tính Y cĩ t loại B1, B2, …, Bt cĩ tần số thực nghiệm tương ứng được cho trong bảng sau:

X Y A1 A2 … Ak cộng B1 n11 n12 … n1k m1 B2 n21 n22 … n2k m2 … … … … … … Bt nt1 nt2 … ntk mt cộng a1 a2 … ak n

Vấn đề đặt ra là đặc tính X và Y trong dân số D cĩ phụ thuộc hay khơng, ngưỡng sai lầm ? Chú ý: Điều kiện để áp dụng tiêu chuẩn phù hợp 2 theo K.Pearson là các tần số quan sát

5

ij

n . Nếu các nij quá nhỏ phải ghép các giá trị hay các khoảng giá trị lại để tăng nij lên. Cách thực hiện:

1. Đặt giả thuyết H: Khơng cĩ sự phụ thuộc giữa X và Y trong dân số D 2. Tính các phân phối lý thuyết n/i1, n/i2, …, n/ik với i=1,2,…,t

Ta cĩ: k loại mẫu A1 A2 … Ak cộng B1 n11 n12 … n1k m1 B2 n21 n22 … n2k m2 … … … … … … Bt nt1 nt2 … ntk mt cộng a1 a2 … ak n

Khi đĩ, tần số lý thuyết n được tính như sau: /ij n/ij m .ai j; i 1,2,..., t; j 1,2,...,k n    3. Tính t k ij / / 2ij i 1 j 1 ij (n n ) Q n    

với  là ngưỡng sai lầm;  là độ tự do của 2(trong đĩ  (t 1)(k 1) ) Ví dụ 7.20: Quan sát 124 người về màu mắt và màu tĩc, kết quả như sau:

màu tĩc

màu mắt Vàng hoe Nâu Đen Vàng đỏ cộng

Xanh 25 9 3 7 44

Xám lục 13 17 10 7 47

Nâu mận 7 13 8 5 33

cộng 45 39 21 19 124

Cĩ sự phụ thuộc giữa màu mắt và màu tĩc con người khơng? ( = 0,05) Giải:

1. Đặt giả thuyết H: Khơng cĩ sự phụ thuộc giữa màu mắt và màu tĩc con người 2. Tính tần số lý thuyết n /ij

màu tĩc

màu mắt Vàng hoe Nâu Đen Vàng đỏ cộng

Xanh 15,96 13,85 7,46 6,75 44 Xám lục 17,06 14,79 7,96 7,19 47 Nâu mận 11,98 10,36 5,58 5,06 33 cộng 45 39 21 19 124 3. Ta cĩ t k ij / / 2ij i 1 j 1 ij (n n ) Q 15 n      4. Vì Q 19,4  20,05(  (3 1)(4 1) 6) 12,6    bác bỏ H

Vậy cĩ sự phụ thuộc giữa màu mắt và màu tĩc con người, ngưỡng sai lầm  = 0,05. Ví dụ 7.21: Quan sát 1500 người về nhĩm máu và mức độ bị bệnh X, kết quả như sau:

nhĩm máu bệnh X A B AB O cộng khơng cĩ 543 211 90 476 1320 nhẹ 44 22 8 31 105 nặng 28 9 7 31 75 cộng 615 242 105 538 1500

Cĩ sự phụ thuộc giữa nhĩm máu và bệnh X khơng? ( = 0,05) Giải:

1. Đặt giả thuyết H: Khơng cĩ sự phụ thuộc giữa nhĩm máu và bệnh X 2. Tính tần số lý thuyết n /ij

nhĩm máu

khơng cĩ 541,2 211,9 92,4 473,5 1320 nhẹ 43,1 16,9 7,4 37,7 105 nặng 30,7 12,1 5,2 26,9 75 cộng 615 242 105 538 1500 3. Ta cĩ t k ij / / 2ij i 1 j 1 ij (n n ) Q 5,12 n      4. Vì Q 5,12  20,05(  (3 1)(4 1) 6) 12,6    chấp nhận H

BÀI TẬP CHƯƠNG 7

Bài 7.1. Khám ngẫu nhiên 200 người cĩ 15 người mắc bệnh K phổi. Hỏi quan sát này cĩ phù hợp với tỷ lệ bệnh K phổi trong cộng đồng là 7% khơng?

Bài 7.2. Tỉ lệ mắc bệnh B ở một địa phương là 4%. Trong một lần kiểm tra sức khỏe ngẫu nhiên cho 300 người thấy cĩ 24 người mắc bệnh B. Với mức ý nghĩa 5%, cĩ thể cho rằng tỉ lệ người bệnh B cĩ xu hướng tăng lên khơng?

Bài 7.3. Bệnh B gây tử vong 20%. Dùng phương pháp A điều trị ngẫu nhiên 200 người, cĩ 29 người tử vong. Với số liệu này cĩ đủ kết luận phương pháp A cĩ hiệu quả khơng với mức ý nghĩa 5%?

Bài 7.4. Người ta muốn xem xét Aspirin cĩ ảnh hưởng đến bị huyết khối khi thay van tim hay khơng? Chọn ngẫu nhiên 188 bệnh nhân sau khi thay van tim, cho dùng 100 mg Aspirin/ngày trong 4 năm liền, kết quả cĩ 21 người bị huyết khối? Số liệu trên cĩ phù hợp với kết quả: cĩ khoảng 12% người bị huyết khối khi thay van tim trong vịng 4 năm khơng?

Bài 7.5. Trong một dây chuyền sản xuất cĩ 20% viên khơng đạt chuẩn. Một cải tiến được thực hiện và sản xuất thử 200 viên thì cĩ 25 viên khơng đạt chuẩn?

a) Việc cải tiến trên cĩ làm thay đổi tỷ lệ viên thuốc khơng đạt chuẩn hay khơng với mức ý nghĩa 5%?

b) Với mức ý nghĩa 1%, việc cải tiến cĩ làm tăng tỷ lệ viên thuốc đạt chuẩn hay khơng?

Bài 7.6. Một phương pháp chiết suất dược liệu cho trung bình 150 (gam cao/1 kg dược liệu) và độ lệch chuẩn 20 (gam cao/1 kg dược liệu). Một cải tiến được thực hiện, sau khi chiết xuất 30 lần, tính được trung bình mẫu 160 (gam cao/1 kg dược liệu). Kết luận cải tiến trên với mức ý nghĩa 5%?

Bài 7.7. Một bệnh viện đang tiến hành thử nghiệm hai phương pháp mới trong việc điều trị bệnh B. Người ta tiến hành 1200 bệnh nhân bệnh B theo hai phương pháp: Phương pháp A điều trị 500 bệnh nhân bệnh B thì thấy cĩ 425 bệnh nhân khỏi bệnh, phương pháp B điều trị 700 bệnh nhân bệnh B thì thấy cĩ 616 bệnh nhân khỏi bệnh. Hãy so sánh hiệu quả của hai phương pháp điều trị trên với mức ý nghĩa 1%?

Bài 7.8. Năng suất lúa trung bình của vụ trước là 45 tạ / ha. Vụ lúa năm nay, người ta áp dụng biện pháp kỹ thuật mới cho tồn bộ diện tích trồng lúa trong vùng. Theo dõi năng suất lúa ở 100 ha, ta cĩ bảng số liệu sau:

a) Hãy cho kết luận về biện pháp kỹ thuật mới này với độ tin cậy 95%?

b) Năng suất lúa trung bình từ 55 tạ / ha thì được xếp vào lúa loại I. Năng suất trung bình của lúa loại I năm trước là 63 tạ / ha. Người ta cơng bố sau khi áp dụng biện pháp kỹ thuật mới, năng suất lúa loại 1 cao hơn 63 tạ / ha cĩ chấp nhận được khơng với mức ý nghĩa 1%? (Giả thuyết năng suất lúa trong vùng là biến ngẫu nhiên cĩ phân phối chuẩn)

Năng suất (tạ / ha) Diện tích (ha)  35 7 35 - 40 12 40 - 45 18 45 - 50 27 50 - 55 20 55 - 60 8 60 - 65 5 > 65 3 cộng 100

c) Một tài liệu cho rằng: tỷ lệ lúa loại I của vùng cao hơn 20%. Với mức ý nghĩa 1%, nhận xét tài liệu trên?

Bài 7.9. Khảo sát trọng lượng trung bình của con so và con rạ. Người ta cân 95 con so và tính được

12,798 ; 10,436

x kg s kg; cân 105 con rạ và tính được x2 3,166 ;kg s10,469kg. Kết luận trọng lượng trung bình của con so và con rạ với mức ý nghĩa 1%?

Bài 7.10. Đánh giá tác dụng của thuốc X đối với số hồng cầu của bệnh nhân, người ta tiến hành quan sát số hồng cầu của người bệnh trước và sau khi uống thuốc X, kết quả cho trong bảng sau:

Trước 45 36 47 40 45 35 36 50 50 40 40 30 45 30 45 40 50 40 50 55 Sau 48 40 53 40 45 30 40 60 50 40 40 35 50 40 60 45 50 40 45 50 Cĩ ý kiến cho rằng số hồng cầu của người bệnh tăng lên sau khi uống thuốc X. Nhận xét ý kiến

trên với mức ý nghĩa 1%?

Bài 7.11. Điều tra lượng cholesterol tồn phần trong huyết thanh của 25 bệnh nhân bị bệnh X và tính được trung bình mẫu là 172mg với độ lệch chuẩn mẫu là 40mg. Biết rằng lượng cholesterol tồn phần của người bình thường là 156mg. Kết luận lượng cholesterol tồn phần trong huyết thanh của bệnh nhân bị bệnh X với mức ý nghĩa 5%?

Bài 7.12. So sánh độ tăng trọng của hai loại thuốc bổ A và B, người ta tiến hành chọn hai nhĩm để thử hai loại thuốc bổ A, B trong 3 tháng. Kết quả cho trong bảng sau:

Nhĩm uống thuốc A 5 4 2 1 4

Nhĩm uống thuốc B 6 5 4 2 6 4 5

Kết luận về độ tăng trọng của hai loại thuốc bổ A, B với mức ý nghĩa 1%?

Bài 7.13. Nghiên cứu độ tăng lực của chuột sau khi uống thuốc X. Người ta cho chuột leo cây cho đến khi kiệt sức, thời gian tính bằng phút.

Chuột trước khi uống thuốc X 34 36 30 24 40 44 50 Chuột sau khi uống thuốc X 46 56 28 34 56 64 70 Kết luận về độ tăng lực của chuột sau khi uống thuốc X với mức ý nghĩa 5%?

Bài 7.14. Được biết nhịp mạch trung bình của nam thanh niên là 72 lần/phút. Kiểm tra 64 thanh niên làm việc trong hầm lị thấy nhịp mạch trung bình là 74 lần/phút và s= 9 lần/phút. Hãy xét xem làm việc trong hầm lị cĩ làm tăng nhịp mạch hay khơng với mức ý nghĩa 1%?

Bài 7.15. Biết chiều cao trung bình của thanh niên địa phương A là biến ngẫu nhiên cĩ phân phối chuẩn với trung bình = 1,60 (m). Tiến hành đo ngẫu nhiên 80 người ở địa phương A, tính được trung bình x1,64 (m) và s = 0,3 (m). Với mức ý nghĩa  = 5%, cho biết kết quả này cĩ phù

hợp với giá trị cho biết khơng?

Bài 7.16. Một nhà máy sản xuất với tỉ lệ sản phẩm loại A lúc đầu là 20%. Sau khi áp dụng phương pháp sản xuất mới, nhà máy tiến hành kiểm tra 500 sản phẩm thì thấy cĩ 150 sản phẩm loại A. a) Hãy cho biết hiệu quả của phương pháp mới này với mức ý nghĩa 5%?

b) Nếu nhà máy kết luận tỉ lệ sản phẩm loại A của họ sau khi áp dụng phương pháp mới là 25% với độ tin cậy 98% cĩ chấp nhận được khơng ?

Bài 7.17. Đường kính của một chi tiết máy được gọi là đạt yêu cầu kỹ thuật khi phương sai đường kính khơng vượt quá 1mm2. Người ta chọn ra một mẫu ngẫu nhiên 25 chi tiết máy và tính được phương sai đường kính trên mẫu là 1,38mm2. Với mức ý nghĩa 5%, cĩ thể kết luận gì về quá trình sản xuất chi tiết máy? (Giả thiết chiều dài của chi tiết máy là biến ngẫu nhiên cĩ phân phối chuẩn)

Bài 7.18. Một nhà máy tiện tự động quy định phương sai của đường kính trục máy bằng

2 36cm2

 , biết rằng đường kính trục máy của nhà máy là biến ngẫu nhiên cĩ phân phối chuẩn. Người ta tiến hành quan sát 25 đường kính của trục máy và tính được s2 35,266cm2. Với mức ý nghĩa 5%, hãy cho biết kết luận về quá trình sản xuất?

Bài 7.19. Để so sánh trọng lượng trung bình của trẻ sơ sinh thành thị và nơng thơn, người ta tiến hành theo dõi 4000 trẻ sơ sinh ở nơng thơn và tính được trung bình x1 3,0(kg) với độ lệch chuẩn mẫu s10,9(kg); theo dõi 6000 trẻ sơ sinh ở thành thị và tính được trung bình

2 3,2

x (kg) với độ lệch chuẩn mẫu s2 0,4(kg). Với mức ý nghĩa 5%, cĩ thể xem trọng lượng trung bình trẻ sơ sinh ở thành thị cao hơn nơng thơn được khơng? Giả thiết trọng lượng trung bình của trẻ sơ sinh là biến ngẫu nhiên cĩ phân phối chuẩn.

Bài 7.20. Để kiểm tra độ chính xác của 2 chiếc máy tiện, người ta chọn ngẫu nhiên 10 chiếc trục được tiện từ máy 1 và thấy phương sai đường kính trục là 25, và chọn ngẫu nhiên 12 chiếc trục được tiện từ máy 2 và thấy phương sai đường kính trục là 18. Với mức ý nghĩa 1% cĩ thể kết luận độ chính xác của 2 máy như nhau khơng?

Bài 7.21. Quan sát trọng lượng (kg) của một nhĩm 100 em trai ở 16 tuổi ở 1 địa phương cĩ kết quả sau:

Trọng lượng X (kg)  40 40 - 45 45 - 50 50 - 55 55 - 60 60 - 65 > 65

Số người 8 11 18 23 20 11 9

Chương 8

TƯƠNG QUAN VÀ HỒI QUI 8.1. Mối quan hệ của hai biến ngẫu nhiên

8.1.1. Khái niệm biến ngẫu nhiên hai chiều

* Giả sử X và Y là hai biến ngẫu nhiên cùng tham gia vào kết quả của một phép thử. Khi đĩ, biến ngẫu nhiên (X,Y) mà mỗi giá trị của nĩ là một cặp số (x,y), trong đĩ x X và y Y , được gọi là biến ngẫu nhiên hai chiều, ký hiệu V = (X,Y).

X,Y là các thành phần của biến ngẫu nhiên hai chiều (X,Y) * Cĩ hai loại biến ngẫu nhiên hai chiều (X,Y)

- Biến ngẫu nhiên hai chiều rời rạc nếu các thành phần của nĩ là các biến ngẫu nhiên rời rạc. - Biến ngẫu nhiên hai chiều liên tục nếu các thành phần của nĩ là các biến ngẫu nhiên liên tục. 8.1.2. Mối quan hệ của hai biến ngẫu nhiên

Cho hai biến ngẫu nhiên X và Y. Khi đĩ, ta thấy giữa chúng cĩ những mối quan hệ sau: (i) X và Y độc lập với nhau, nghĩa là việc nhận giá trị của biến ngẫu nhiên này khơng ảnh hưởng đến việc nhận giá trị của biến ngẫu nhiên kia.

(ii) X và Y phụ thuộc lẫn nhau tức là Y = (X) hoặc X = (Y) (iii) X và Y phụ thuộc tương quan hoặc phụ thuộc khơng tương quan. 8.1.3. Đồ thị phân tán

Cho hệ trục tọa độ Descartes vuơng gĩc. Với một giá trị của X Yi, i được biểu diễn bởi một điểm M x y i, i trên hệ trục tọa độ. Đồ thị phân tán của hai biến X, Y là tập hợp tất cả các điểm

 i, i

M x y trên hệ trục tọa độ.

Chú ý: Dựa vào đồ thị phân tán, nếu các điểm M x y i, i tập trung xung quanh một đường thẳng  thì ta nĩi hai biến X, Y cĩ tương quan tuyến tính. và đường thẳng  được gọi là đường hồi qui tuyến tính. Nếu các điểm M x y i, i tập trung xung quanh một đường cong (C) thì ta nĩi hai biến X, Y cĩ tương quan phi tuyến tính và đường cong (C) được gọi là đường hồi qui phi tuyến tính, đường hồi qui phi tuyến tính cĩ thể là một hàm theo logarit, mũ, lũy thừa,… Nếu các điểm M x y i, i khơng tập trung xung quanh bất cứ đường thẳng hay đường cong nào thì ta nĩi hai biến X, Y khơng tương quan.

8.2. Hệ số tương quan

8.2.1. Moment tương quan (Hiệp phương sai - Covarian)

Định nghĩa: Moment tương quan (hiệp phương sai) của hai biến ngẫu nhiên X và Y, ký hiệu cov(X,Y) hay XY , là số được xác định như sau:

X Y

Quan hệ phi tuyến tính

X Y Khơng quan hệ X Y Quan hệ tuyến tính 

     ( , )  ( )  ( ) Cov X Y E X E X Y E Y Chú ý (i) ( , )  . . ( ) . ( ) ( ). ( ) ( . ) ( ). ( ) ( ). ( ) ( ). ( ) ( . ) ( ). ( )           Cov X Y E X Y X E X Y E Y E X E Y E X Y E X E Y E X E Y E X E Y E X Y E X E Y

(ii) Với (X,Y) rời rạc:

1 1 cov( , ) ( ). ( )   n m i j ij i j X Y x y p E X E Y

Với (X,Y) liên tục: ( , )   ( , ) ( ). ( )  

   

Cov X Y xyf x y dxdy E X E Y

(iii) Nếu cov(X,Y) = 0. Khi đĩ, ta nĩi X và Y khơng tương quan. (iv) Cov(X,X) = V(X) ; Cov(Y,Y) = V(Y)

8.2.2. Hệ số tương quan

Định nghĩa: Hệ số tương quan của hai biến ngẫu nhiên X và Y, ký hiệu rXY, là số được xác định như sau: cov( , ) ( . ) ( ). ( ) .  .   XY X Y X Y X Y E X Y E X E Y r S S S S

với SX và SY là độ lệch tiêu chuẩn của X và Y.

Ý nghĩa của hệ số tương quan: Hệ số tương quan đo mức độ phụ thuộc tương quan tuyến tính giữa hai biến ngẫu nhiên X và Y. Khi |rXY|  1 thì mức độ quan hệ tuyến tính của X và Y càng chặt; khi |rXY|  0 thì mức độ quan hệ tuyến tính của X và Y càng lỏng.

8.2.3. Ước lượng hệ số tương quan

 Lập mẫu ngẫu nhiên WXY ( , ),( , ),...,( , )X Y1 1 X Y2 2 X Yn n 

 Để ước lượng hệ số tương quan rXY ta dùng thống kê

. .   XY X Y XY X Y R S S trong đĩ: 1 1   n i i X X n ; 1 1   n i i Y Y n ; 1 1   n i i

Một phần của tài liệu XÁC SUẤT THỐNG kê y dược (Trang 147)

Tải bản đầy đủ (PDF)

(189 trang)