T z X-p S'/VK
2.3. Ước lượng tỷ lệ
Giả sử ta cần nghiên cứu một đám đơng kích thước N, trong đó có
M phần tử mang dấu hiệu A. Khi đó P(A) = M/N = p là tỷ lệ phần tử mang dấu hiệu A trên đám đơng. Vì khơng điềù tra cả đám đơng nên thường chưa biết p. Từ đám đông ta lấy ra mẫu kích thước n, điều tra
trên mẫu này thấy có nA phần tử mang dấu hiệu A. Khi đó tần suất
xuất hiện dấu hiệu A trên mẫu là f = —. Ta đi ước lượng p thông qua
n
f. Theo mục 5f4.l.§5 chương VI, khi n khá lớn thì f - N(p,—) và n
N(0,l)
Trong đó q = 1 - p.
Với độ tin cậy 1 - a cho trước ta tìm được phân vị chuẩn ua/2, lập luận tương tự như trong mục 2.2.1 ta có
P( I u I < ua/2)« 1 - a (7.21)
Thay biểu thức của u trong (7.20) vào (7.21) và biến đổi ta có
P( I f - p I <
Biến đổi tương đương ta được
P(f- £<p<f+£)®l-a Trong đó
(7.23)
(7.24) là sai số của ước lượng.
Khi p chưa biết, n lớn để tính sai số £ ta thay p xấp xỉ bằng ước
lượng hiệu quả nhất của nó là f: p « f và q » 1 - f. Khi đó
£ «
Độ tin cậy của ước lượng là 1 - a
Khoảng tin cậy đối xứng của p là
f - £ < p < f + E (7.26)
Độ dài của khoảng tin cậy là 2e.
Chú ý: Để tránh dùng công thức gần đúng (7.25), ta biến đổi tương
đương biểu thức trong ngoặc vế trái của (7.22) bằng cách bình phương
hai vế bất đẳng thức f-pl< , chuyển vế và xét dấu tam thức bậc hai đối với p ta được
Trong đó
P1’P2 -
nf+2Uẳ/2±Ua/2^nf(l-f) + |u2/2
(7.27)
Việc tính tốn theo cơng thức (J.TT) rõ ràng là khá phức tạp, nên
trong thực tế người ta thường dùng các công thức (7.23) - (7.26).
ở đây ta cũng có ba bài tốn cần giải quyết như trong ước lượng
kỳ vọng toán của ĐLNN và cách giải quyết cũng hoàn toàn tương tự. Riêng bài tốn 3 (bài tốn tìm kích thước mẫu), để có (7.20) ta phải giả thiết f có phân phối chuẩn. Sau đó từ (7.24) ta có
(7.28)
Đây chính là giá trị tối thiểu của kích thước mẫu cần tìm.
Trong trường hợp chưa biết p, vì p và q đều là những số không âm mà p + q = 1 nên tích p.q lớn nhất khi p = q = 1/2 . Vì vậy ta ln có
pq < Ậ. Do đó từ cơng thức (7.28) ta có thể lẩy 4
4e2 (7.29)
Tuy nhiên nếu tính kích thước mẫu theo cơng thức (7.29) thì thường làm cho n tăng lên khá nhiều so với mức cần thiết. Vì vậy trong
thực tế người ta thường điều tra một mẫu sơ bộ kích thước n, khơng lớn
lắm, từ mẫu này tìm được f rồi tìm n theo cơng thức (7.28) sau khi thay p«fvàq«l-f. Sau đó ta chỉ cần điều tra thêm một mẫu kích thước
112 = II “ Hị .
Ví dụ: Để kiểm tra chất lượng của một lơ hàng hố, người ta lấy
a/ Với độ tin cậy 0,95 hãy ước lượng tỷ lệ sản phẩm loại II của cả lô hàng.
b/ Để bảo đảm khi ước lượng đạt độ tin cậy 99% và sai số không
vượt quá 0,1 thì phải kiểm tra thêm bao nhiêu sản phẩm nữa?
Giải: Gọi f là tỷ lệ sản phẩm loại II trên mẫu.
Gọi p là tỷ lệ sản phẩm loại II trên đám đơng.
a/ Vì n = 100 khá lớn nên f có phân phối xấp xỉ chuẩn: f=N(p,í3.) =. u = f-p N(0,l)
n
Ta tìm được ua/2 sao cho: P( I u I < ua/2) « 1 - a
Thay biểu thức của u vào cơng thức trên và biến đổi tương đương
ta có P( I f - p I <
<=> P(f - £<p<f+e)«l-a
Trong đó
Vì p chưa biết, n lớn nên ta lấy p « f = 20/100 = 0,2; q « 1 - f = 0,8. Mặt khác ta có 1 - a = 0,95 => a/2 = 0,025, tra bảng ta có u0025 =
1,96 nên £ « J---2;0,8 .1,96 = 0,04.1,96 = 0,0784
V 100
Thay số vào ta có:
0,2 - 0,0784 < p < 0,2 + 0,0784 hay 0,1216 < p < 0,2784
Kết luận: Với độ tin cậy 0,95 ta có thể nói rằng tỷ lệ sản phẩm loại
b/ Giả thiết f có phân phối chuẩn, khi đó ta có thể viết f ~
N(p, —). Vì vậy u = n
f-p
N(O,1)
Tiến hành tương tự như trong câu a/ ta có 8 =
AA ^A „ _ P9‘U a/2
Từ đó ta CĨ n = — 2
8
Vì p chưa biet ta lấy p « f = 20/100 = 0,2; q « 1 - f = 0,8 có trong mẫu ở câu a/.
Vì 1 - a = 0,99 => a/2 = 0,005. Tra bảng ta có u0005 = 2,58. Ta có _ _ 0,2.0,8.2,582
0,l2
Kết luận: Để bảo đảm khi ước lượng tỷ lệ sản phẩm loại II của cả
lô hàng đạt độ tin cậy 99% và sai số khơng vượt q 0,1 thì cần kiểm tra thêm ít nhất 107 - 100 = 7 sản phẩm nữa.
Chú ý r. Nếu biết p, cần ước lượng f thì từ (7.22) ta có
P(p - 8<f<p + e)«l-a
Từ đó ta có khoảng tin cậy đối xứng của f là
p-8<f<p+8
Chú ỷ 2:
• Từ khoảng tin cậy của p:f-8<p<f+8, vìp = M/N, nên nếu
biết N ta có khoảng tin cậy của M là: N(f - 8) < M < N(f + s)
Đương nhiên, nếu biết M ta cũng có thể tìm được khoảng tin cậy
của N:
• Nếu biết khoảng tin cậy của f: p - £ < f < p 4- E, mà f = nA/n, ta có
khoảng tin cậy của nA là:
n(p - e) < nA < n(p + £)
Ví dụ : Biết tỷ lệ phế phẩm của một lô hàng là 0,1. Với độ tin cậy
99% có thể nói gì về số phế phẩm có trong 100 sẩn phẩm được lấy ra
một cách ngẫu nhiên từ lô hàng này?
Giải: Gọi f là tỷ lệ phế phẩm trên mẫu.
Gọi p là tỷ lệ phế phẩm trên đám đơng.
Vì n = 100 khá lớn nên f có phân phối xấp xỉ chuẩn: f = N(p,—).
n
Khi đó N(0,l)
Ta tìm được ua/2 sao cho P( I u I < ua/2) « 1 - a Thay biểu thức của u vào cơng thức trên ta có
P(|f-pl<
Biến đổi tương đương ta có P(p -8<f<p4-E)«l-a
£ =
Trong đó . Vì 1 - a = 0,99 => a/2 = 0,005. Tra bảng ta
có u0>005 = 2,58 => 8 = '0,1.0,9
100 .2,58 = 0,0774
Thay số vào ta có: 0,1 - 0,0774 < f < 0,1 + 0,0774 Hay 0,0226 <f <0,1774
Mà f = nA/n, trong đó n = 100 nên ta có
Kết luận-. Với độ tin cậy 99% ta có thể nói rằng số phế phẩm trong
mẫu lấy ra nằm trong khoảng (2 ; 18).
+ Khoảng tin cậy phải (lấy a, = 0, a2 = a; dùng để ước lượng giá
trị tối thiểu của p)
Ta vẫn dùng thống kê ở (7.20). Với độ tin cậy 1 - a cho trước ta tìm được ua sao cho
P(U < ua) « 1 - a
Thay biểu thức của u ở (7.20) vào biểu thức trên và biến đổi tương đương ta có
P(f-p<
Hay P(f -
Vì p chưa biết khi n lớn ta lấy p ~ f. Ta có khoảng tin cậy phải của
plà(f- ua ; +oo)
+ Khoảng tin cậy trái của p (lấy aI = a, a2 = 0; dùng để ước
lượng giá trị tối đa của p)
Ta cũng dùng thống kê ở (7.20). Với độ tin cậy 1 - a cho trước ta tìm được ua sao cho
P(- ua < U)« 1 - a
Thay biểu thức của u ở (7.20) vào công thức trên và biến đổi ta có
Vì p chưa biết khi n lớn ta lấy p « f. Ta có khoảng tin cậy trái của
p là (-00; f + J ua)
Ví dụ: Điều tra 200 gia đình thấy có 150 gia đình dùng bột giặt
OMO. Với độ tin cậy 95% hãy ước lượng tỷ lệ tối đa gia đình dùng bột giặt OMO.
Giải: Gọi f là tỷ lệ gia đình dùng bột giặt OMO trên mẫu.
Gọi p là tỷ lệ gia đình dùng bột giặt OMO trên đám đơng.
Vì n = 200 khá lớn nên f có phân phối xấp xỉ chuẩn: f - N(p,—). n
Tìm được ua sao cho P(-Ua < U) ® 1 - a
Thay biểu thức của u vào cơng thức trên và biến đổi ta có
Hay P(p < f +
Vì p chưa biết n = 200 khá lớn ta lấy p « f = 150/200 = 0,75.
Giả thiết cho 1 - a = 0,95 a = 0,05. Tra bảng ta có u005 = 1,65.
Thay số vào cơng thức trên ta có:
p < 0,75 + 10,75.025
200 .1,65 => p<0,8
Kếtluận: Với độ tin cậy 95% ta có thể nói rằng tỷ lệ tối đa gia