Bài giảng cung cấp các kiến thức giúp người học có thể phân biệt được sự khác biệt của phân phối xác suất của giá trị cá thể và phân phối xác suất của các ước lượng lấy mẫu, trình bày được công thức tính phân phối xác suất của trung bình mẫu, hiệu số trung bình mẫu, tỉ lệ và hiệu số tỉ lệ của mẫu.
MỘT SỐ NHỮNG PHÂN PHỐI LẤY MẪU QUAN TRỌNG Mục tiêu Sau khi nghiên cứu chủ đề, học viên có khả năng: Phân biệt được sự khác biệt của phân phối xác suất của giá trị cá thể và phân phối xác suất của các ước lượng lấy mẫu Trình bày được cơng thức tính phân phối xác suất của trung bình mẫu, hiệu số trung bình mẫu, tỉ lệ và hiệu số tỉ lệ của mẫu Lấy mẫu ngẫu nhiên đơn Mẫu xác suất là mẫu rút từ dân số theo cách sao cho mọi phần tử trong dân số đều có một xác suất được đưa vào mẫu Mẫu có cỡ mẫu n được rút từ trong dân số có N phần tử sao cho mọi cách lấy mẫu cỡ n đều có một xác suất lựa chọn như nhau, mẫu đó được gọi là mẫu ngẫu nhiên đơn Phương pháp lẫy mẫu còn được chia theo 2 loại: phương pháp lấy mẫu có hồn lại và lấy mẫu khơng hồn lại. Trong phương pháp lấy mẫu hồn lại,một phần tử sau khi được rút chọn để đưa vào mẫu vẫn có khả năng được rút chọn thêm như vậy, một phần tử có thể làm đại diện cho dân số 1, 2, 3 hay nhiều hơn lần. Trong phương pháp lấy mẫu khơng hồn lại, những phần tử được rút chọn rồi sẽ khơng được chọn một lần nữa. Do đó một phần tử có thể được đưa vào mẫu tối đa 1 lần Thí dụ: Giả sử trong một dân số gồm mẫu đường huyết lúc đói của 150 đối tượng. Hãy dùng phương pháp rút chọn ngẫu nhiên đơn để chọn ra một mẫu ngẫu nhiên có cỡ mẫu bằng 10. Tính đường huyết trung bình trong mẫu đó 2.Phân phối lấy mẫu Phân phối của tất cả các giá trị (trung bình) được tính từ các mẫu ngẫu nhiên có cỡ mẫu bằng nhau được gọi là phân phối lấy mẫu (của trung bình) Ngồi tính giá trị trung bình, người ta có thể tính các giá trị khác như độ lệch chuẩn, tỉ lệ v.v Nếu dân số là hữu hạn ta có thể tìm được tất cả các mẫu cỡ n có thể có và sau đó tính phân phối. Nhưng nếu dân số là vơ hạn hay có kích thước lớn thì khơng thể liệt kê tất cả các mẫu, chỉ có thể nghiên cứu phân phối trên một số lớn những mẫu mà thơi Phân phối trung bình mẫu Thí dụ:Giả sử chúng ta có một dân số có cỡ mẫu N = 5, bao gồm tuổi của năm đứa trẻ là bệnh nhân ngoại trú của một trung tâm sức khỏe tâm thần. Tuổi các đứa trẻ là như sau: x1 = 6, x2 = 8, x3 = 10, x4 = 12, x5 = 14. Tuổi trung bình của dân số này là Σxi /N = 10 và có phương sai σ2 = 8 Nếu chúng ta chọn mẫu có hồn lại, có thể có đến 25 mẫu. Sau đó ta có thể xây dựng phân phối lấy mẫu của x bằng cách liệt kê tất cả các giá trị của x ở một cột và tần suất xuất hiện ở cột kia Và khi đó chúng ta có thể tính được trung bình của x µx = 250 / 25 = 10 và σ2 = 4 Ðịnh lí giới hạn trung tâm: Cho một dân số với bất kì hình dnạg phân phối nào với trung bình là µ và phương sai là σ2 , phân phối lấy mẫu của x, tính từ mẫu cỡ n của dân số này sẽ có phân phối xấp xỉ bình thường với trung bình là µ và phương sai là σ2/n, khi cỡ mẫu lớn (cỡ mẫu ≥ 30) Lưu ý: Khi các giá trị của phân phối đã là phân phối xấp xỉ bình thường thì định lí trên đúng, khơng cần điều kiện cỡ mẫu lớn . khi mẫu cỡ n là mẫu khơng hồn lại từ một dân số hữu hạn, phân phối lấy mẫu của x, tính từ mẫu cỡ n của dân số này sẽ có phân phối xấp xỉ bình thường với trung bình là (và phương sai là [(Nn)/(N1)]σ2/n, khi cỡ mẫu lớn (cỡ mẫu ≥ 30). Hệ số (Nn)/(N 1) được gọi là hệ số hiệu chỉnh dân số hữu hạn. Thơng thường người ta khơng quan tâm đến hệ số này trừ khi cỡ mẫu lớn hơn 5% quy mơ của dân số Ứng dụng Nếu chúng ta biết chiều dài xương sọ là phân phối xấp xỉ bình thường với trung bình là 185,6 mm và độ lệch chuẩn 12,7 mm. Tính xác suất mẫu có cỡ mẫu 10 rút ra từ dân số này có trung bình lớn hơn 190 Bài giải: Phân phối lấy mẫu của trung bình của chiều dài xương sọ sẽ có phân phối xấp xỉ bình thường với trung bình là 185,6 mm và độ lệch chuẩn = 12.7/√10 = 4,02 Giá trị chiều dài xương sọ 190 tương ứng với z = (190185,6)/4,02 =1,09 Từ bảng phân phối chuẩn, ta biết diện tích phần bên phải 1,09 là 0,1379 hay xác suất một mẫu có cỡ mẫu 10 có trung bình lớn hơn 190 là 0,1379 Phân phối hiệu số hai trung bình mẫu Thí dụ: Giả sử chúng ta có hai dân số một dân số gồm những đứa trẻ bị suy dinh dưỡng lúc nhỏ và một dân số gồm những trẻ khơng bị suy dinh dưỡng. Phân phối của thương số thơng minh của hai dân số này là xấp xỉ bình thường và có độ lệch chuẩn khoảng 20. Nếu chúng ta lấy một mẫu gồm 15 người trong mỗi dân số và tính thương số thơngminh của mỗi nhóm có kết quả như sau x1 = 92, x2 = 105. Nếu khơng có sự khác biệt về trí thơng minh giữa hai nhóm trẻ em. Tính xác suất có thể quan sát được sự khác biệt này hoặc khác biệt nhiều hơn của hiệu số ( x1 x2 ) giữa hai trung bình mẫu Áp dụng cơng thức: ( x1 x ) ( 2) z 2 n1 n2 Ta tính được z = 1,78 Do đó nếu khơng có sự khác biệt về trung bình dân số, xác suất có được sự khác biệt giữa trung bình dân số ≥ 13 là 0,0375 6 Phân phối tỉ lệ mẫu Thí dụ: Nếu chúng ta biết trong dân số tỉ lệ mù màu π là 0,08. Nếu chúng ta chọn ngẫu nhiên trong dân số 150 đối tượng , xác suất để tỉ lệ mù màu p lên đến 0,15 Theo cơng thức: p z (1 n Ta tính được z= 3,15. Tra bảng phân phối chuẩn ta có xác suất quan sát được p ≥ 0,08 là 0,0008. Do vậy tìm được một mẫu như vậy là một sự kiện hiếm Phân phối hiệu số hai tỉ lệ mẫu Thí dụ: Trong một dân số người ta biết rằng tỉ lệ trẻ em trai bị béo phì π1 = 10%. Giả sử cũng có tỉ lệ trẻ em gái bị béo phì π2 = 10%, tìm xác suất một mẫu gồm 250 trẻ trai và 200 trẻ gái sẽ cho giá trị p1 p2 ≥ 0,06 Theo công thức z ( p1 (1 n1 p2 ) ( ) 2 (1 n2 ) ) Ta tính được z = 2,11. Vậy xác suất này là 0,0174 Bài tập Bài tập phân phối lấy mẫu 1. Nếu chúng ta biết chiều dài xương sọ là phân phối xấp xỉ bình thường với trung bình là 185,6 mm và độ lệch chuẩn 12,7 mm. Tính xác suất mẫu có cỡ mẫu 10 rút ra từ dân số này có trung bình lớn hơn 190 2. Nếu trung bình và độ lệch chuẩn của sắt huyết thanh ở người đàn ơng khỏe mạnh là 120 và 15 microgram/100 ml, tính xác suất một mẫu ngẫu nhiên gồm 50 người đàn ơng có trung bình sắt huyết thanh ở giữa 115 và 125 microgram/100 ml 3. Giả sử chúng ta có hai dân số một dân số gồm những đứa trẻ bị suy dinh dưỡng lúc nhỏ và một dân số gồm những trẻ khơng bị suy dinh dưỡng. Phân phối của thương số thơng minh của hai dân số này là xấp xỉ bình thường và có độ lệch chuẩn khoảng 20. Nếu chúng ta lấy một mẫu gồm 15 người trong mỗi dân số và tính thương số thơngminh của mỗi nhóm có kết quả như sau x1 = 92, x2 = 105. Nếu khơng có sự khác biệt về trí thơng minh giữa hai nhóm trẻ em. Tính xác suất có thể quan sát được sự khác biệt này hoặc khác biệt nhiều hơn của hiệu số ( x1 x2 ) giữa hai trung bình mẫu 4. Trong một dân số nam thanh niên và nữ thanh niên 17 tuổi, trung bình và độ lệch chuẩn của chiều dày nếp gấp da vùng dưới xương bả vai là như sau: nam 9,7 và 6,0; nữ 15,6 và 9,5. Một mẫu ngẫu nhiên đơn gồm 40 nam và 35 nữ được chọn từ dân số này. Tính xác suất sự khác biệt giữa trung bình mẫu (xnu xnam ) sẽ lớn hơn 10? 5. Nếu chúng ta biết trong dân số tỉ lệ mù màu là 0,08. Nếu chúng ta chọn ngẫu nhiên trong dân số 150 đối tượng , xác suất để tỉ lệ mù màu lên đến 0,15 6. Trung tâm y tế dự phòng tỉnh Cần thơ cho biết tỉ lệ trẻ em 1218 tháng tiêm chủng phòng chống đủ 6 bệnh EPI là 90%. Chọn một mẫu ngẫu nhiên đơn gồm 200 trẻ trong lứa tuổi này và kiểm tra tình trạng tiêm chủng. Tính xác suất tỉ lệ tiêm chủng trong mẫu này dưới 85% 7. Trong một dân số người ta biết rằng 10% những trẻ em trai bị béo phì. Giả sử cũng có 10% trẻ em gái bị béo phì, tìm xác suất một mẫu gồm 250 trẻ trai và 200 trẻ gái sẽ cho giá trị p1 p2 ≥ 0,06 Bài giải Phân phối lấy mẫu của trung bình của chiều dài xương sọ sẽ có phân phối xấp xỉ bình thường với trung bình 185,6 mm độ lệch chuẩn = 12.7/√10 = 4,02 Do đó, giá trị chiều dài xương sọ 190 tương ứng với z = (190 185,6)/4,02 =1,09 P (x >190) = P (z >1,09) = 1 P(z ≤ 1,09) = 1 0,8621 = 0,1379 2. Theo định lí giới hạn trung tâm, giá trị trung bình sắt huyết thanh trung bình x của 50 người đàn ơng sẽ có phân phối bình thường (trung bình là 120 và độ lệch chuẩn = 15/√50 = 2,12. Khi đó P (115 3,15) = 1 P(z ≤ 3,15) = 1 0,9992 = 0,0008 Xác suất này là rất hiếm 6. Theo thống kê về phân phối tỉ lệ của mẫu, ta có z p (1 n có phân phối bình thường π: tỉ lệ tiêm chủng trong dân số = 0,90 p: tỉ lệ tiêm chủng trong mẫu = 0,85 n: cỡ mẫu = 200 Ta tính được z= 2,36 Do đó: với P(pâ ≤ 0.85) = P(z ≤ 2,36) = 0,0091 ≈ 1/100 7. Theo thống kê về phân phối tỉ lệ của mẫu, ta có z ( p1 (1 n1 p2 ) ( ) 2 (1 n2 ) ) có phân phối bình thường với với π1: tỉ lệ béo phì trong dân số nam = 0,10 π2: tỉ lệ béo phì trong dân số nữ = 0,10 p1: tỉ lệ béo phì trong mẫu gồm 250 nam p2: tỉ lệ béo phì trong mẫu gồm 200 nữ, pâ1 pâ2 = 0,06 n1 là cỡ mẫu của nhóm nam = 250 n2 là cỡ mẫu của nhóm nữ = 200 Do đó P{(p1 p2 )≥ 0,06} = P(z ≥ 2,11) = 1 P(z ≤ 2,11) = 1 0,9826 = 0,0174 ... Ðịnh lí giới hạn trung tâm: Cho một dân số với bất kì hình dnạg phân phối nào với trung bình là µ và phương sai là σ2 , phân phối l y mẫu của x, tính từ mẫu cỡ n của dân số n y sẽ có phân phối xấp xỉ bình thường với trung bình là ... . khi mẫu cỡ n là mẫu khơng hồn lại từ một dân số hữu hạn, phân phối l y mẫu của x, tính từ mẫu cỡ n của dân số n y sẽ có phân phối xấp xỉ bình thường với trung bình là (và phương sai là [(Nn)/(N1)]σ2/n, khi cỡ mẫu lớn (cỡ mẫu ≥... bảng phân phối chuẩn, ta biết diện tích phần bên phải 1,09 là 0,1379 hay xác suất một mẫu có cỡ mẫu 10 có trung bình lớn hơn 190 là 0,1379 Phân phối hiệu số hai trung bình mẫu Thí dụ: Giả sử chúng ta có hai dân số một dân số gồm những đứa trẻ bị suy dinh