Ước lượng tỷ lệ

Một phần của tài liệu Giáo trình Lý thuyết xác suất và thống kê toán: Phần 2 - Mai Chi, Trần Doãn Phú (Trang 59 - 67)

T z X-p S'/VK

2.3. Ước lượng tỷ lệ

Giả sử ta cần nghiên cứu một đám đơng kích thước N, trong đó có

M phần tử mang dấu hiệu A. Khi đó P(A) = M/N = p là tỷ lệ phần tử mang dấu hiệu A trên đám đơng. Vì khơng điềù tra cả đám đơng nên thường chưa biết p. Từ đám đông ta lấy ra mẫu kích thước n, điều tra

trên mẫu này thấy có nA phần tử mang dấu hiệu A. Khi đó tần suất

xuất hiện dấu hiệu A trên mẫu là f = —. Ta đi ước lượng p thông qua

n

f. Theo mục 5f4.l.§5 chương VI, khi n khá lớn thì f - N(p,—) và n

N(0,l)

Trong đó q = 1 - p.

Với độ tin cậy 1 - a cho trước ta tìm được phân vị chuẩn ua/2, lập luận tương tự như trong mục 2.2.1 ta có

P( I u I < ua/2)« 1 - a (7.21)

Thay biểu thức của u trong (7.20) vào (7.21) và biến đổi ta có

P( I f - p I <

Biến đổi tương đương ta được

P(f- £<p<f+£)®l-a Trong đó

(7.23)

(7.24) là sai số của ước lượng.

Khi p chưa biết, n lớn để tính sai số £ ta thay p xấp xỉ bằng ước

lượng hiệu quả nhất của nó là f: p « f và q » 1 - f. Khi đó

£ «

Độ tin cậy của ước lượng là 1 - a

Khoảng tin cậy đối xứng của p là

f - £ < p < f + E (7.26)

Độ dài của khoảng tin cậy là 2e.

Chú ý: Để tránh dùng công thức gần đúng (7.25), ta biến đổi tương

đương biểu thức trong ngoặc vế trái của (7.22) bằng cách bình phương

hai vế bất đẳng thức f-pl< , chuyển vế và xét dấu tam thức bậc hai đối với p ta được

Trong đó

P1’P2 -

nf+2Uẳ/2±Ua/2^nf(l-f) + |u2/2

(7.27)

Việc tính tốn theo cơng thức (J.TT) rõ ràng là khá phức tạp, nên

trong thực tế người ta thường dùng các công thức (7.23) - (7.26).

ở đây ta cũng có ba bài tốn cần giải quyết như trong ước lượng

kỳ vọng toán của ĐLNN và cách giải quyết cũng hoàn toàn tương tự. Riêng bài tốn 3 (bài tốn tìm kích thước mẫu), để có (7.20) ta phải giả thiết f có phân phối chuẩn. Sau đó từ (7.24) ta có

(7.28)

Đây chính là giá trị tối thiểu của kích thước mẫu cần tìm.

Trong trường hợp chưa biết p, vì p và q đều là những số không âm mà p + q = 1 nên tích p.q lớn nhất khi p = q = 1/2 . Vì vậy ta ln có

pq < Ậ. Do đó từ cơng thức (7.28) ta có thể lẩy 4

4e2 (7.29)

Tuy nhiên nếu tính kích thước mẫu theo cơng thức (7.29) thì thường làm cho n tăng lên khá nhiều so với mức cần thiết. Vì vậy trong

thực tế người ta thường điều tra một mẫu sơ bộ kích thước n, khơng lớn

lắm, từ mẫu này tìm được f rồi tìm n theo cơng thức (7.28) sau khi thay p«fvàq«l-f. Sau đó ta chỉ cần điều tra thêm một mẫu kích thước

112 = II “ Hị .

Ví dụ: Để kiểm tra chất lượng của một lơ hàng hố, người ta lấy

a/ Với độ tin cậy 0,95 hãy ước lượng tỷ lệ sản phẩm loại II của cả lô hàng.

b/ Để bảo đảm khi ước lượng đạt độ tin cậy 99% và sai số không

vượt quá 0,1 thì phải kiểm tra thêm bao nhiêu sản phẩm nữa?

Giải: Gọi f là tỷ lệ sản phẩm loại II trên mẫu.

Gọi p là tỷ lệ sản phẩm loại II trên đám đơng.

a/ Vì n = 100 khá lớn nên f có phân phối xấp xỉ chuẩn: f=N(p,í3.) =. u = f-p N(0,l)

n

Ta tìm được ua/2 sao cho: P( I u I < ua/2) « 1 - a

Thay biểu thức của u vào cơng thức trên và biến đổi tương đương

ta có P( I f - p I <

<=> P(f - £<p<f+e)«l-a

Trong đó

Vì p chưa biết, n lớn nên ta lấy p « f = 20/100 = 0,2; q « 1 - f = 0,8. Mặt khác ta có 1 - a = 0,95 => a/2 = 0,025, tra bảng ta có u0025 =

1,96 nên £ « J---2;0,8 .1,96 = 0,04.1,96 = 0,0784

V 100

Thay số vào ta có:

0,2 - 0,0784 < p < 0,2 + 0,0784 hay 0,1216 < p < 0,2784

Kết luận: Với độ tin cậy 0,95 ta có thể nói rằng tỷ lệ sản phẩm loại

b/ Giả thiết f có phân phối chuẩn, khi đó ta có thể viết f ~

N(p, —). Vì vậy u = n

f-p

N(O,1)

Tiến hành tương tự như trong câu a/ ta có 8 =

AA ^A „ _ P9‘U a/2

Từ đó ta CĨ n = — 2

8

Vì p chưa biet ta lấy p « f = 20/100 = 0,2; q « 1 - f = 0,8 có trong mẫu ở câu a/.

Vì 1 - a = 0,99 => a/2 = 0,005. Tra bảng ta có u0005 = 2,58. Ta có _ _ 0,2.0,8.2,582

0,l2

Kết luận: Để bảo đảm khi ước lượng tỷ lệ sản phẩm loại II của cả

lô hàng đạt độ tin cậy 99% và sai số khơng vượt q 0,1 thì cần kiểm tra thêm ít nhất 107 - 100 = 7 sản phẩm nữa.

Chú ý r. Nếu biết p, cần ước lượng f thì từ (7.22) ta có

P(p - 8<f<p + e)«l-a

Từ đó ta có khoảng tin cậy đối xứng của f là

p-8<f<p+8

Chú ỷ 2:

• Từ khoảng tin cậy của p:f-8<p<f+8, vìp = M/N, nên nếu

biết N ta có khoảng tin cậy của M là: N(f - 8) < M < N(f + s)

Đương nhiên, nếu biết M ta cũng có thể tìm được khoảng tin cậy

của N:

• Nếu biết khoảng tin cậy của f: p - £ < f < p 4- E, mà f = nA/n, ta có

khoảng tin cậy của nA là:

n(p - e) < nA < n(p + £)

Ví dụ : Biết tỷ lệ phế phẩm của một lô hàng là 0,1. Với độ tin cậy

99% có thể nói gì về số phế phẩm có trong 100 sẩn phẩm được lấy ra

một cách ngẫu nhiên từ lô hàng này?

Giải: Gọi f là tỷ lệ phế phẩm trên mẫu.

Gọi p là tỷ lệ phế phẩm trên đám đơng.

Vì n = 100 khá lớn nên f có phân phối xấp xỉ chuẩn: f = N(p,—).

n

Khi đó N(0,l)

Ta tìm được ua/2 sao cho P( I u I < ua/2) « 1 - a Thay biểu thức của u vào cơng thức trên ta có

P(|f-pl<

Biến đổi tương đương ta có P(p -8<f<p4-E)«l-a

£ =

Trong đó . Vì 1 - a = 0,99 => a/2 = 0,005. Tra bảng ta

có u0>005 = 2,58 => 8 = '0,1.0,9

100 .2,58 = 0,0774

Thay số vào ta có: 0,1 - 0,0774 < f < 0,1 + 0,0774 Hay 0,0226 <f <0,1774

Mà f = nA/n, trong đó n = 100 nên ta có

Kết luận-. Với độ tin cậy 99% ta có thể nói rằng số phế phẩm trong

mẫu lấy ra nằm trong khoảng (2 ; 18).

+ Khoảng tin cậy phải (lấy a, = 0, a2 = a; dùng để ước lượng giá

trị tối thiểu của p)

Ta vẫn dùng thống kê ở (7.20). Với độ tin cậy 1 - a cho trước ta tìm được ua sao cho

P(U < ua) « 1 - a

Thay biểu thức của u ở (7.20) vào biểu thức trên và biến đổi tương đương ta có

P(f-p<

Hay P(f -

Vì p chưa biết khi n lớn ta lấy p ~ f. Ta có khoảng tin cậy phải của

plà(f- ua ; +oo)

+ Khoảng tin cậy trái của p (lấy aI = a, a2 = 0; dùng để ước

lượng giá trị tối đa của p)

Ta cũng dùng thống kê ở (7.20). Với độ tin cậy 1 - a cho trước ta tìm được ua sao cho

P(- ua < U)« 1 - a

Thay biểu thức của u ở (7.20) vào công thức trên và biến đổi ta có

Vì p chưa biết khi n lớn ta lấy p « f. Ta có khoảng tin cậy trái của

p là (-00; f + J ua)

Ví dụ: Điều tra 200 gia đình thấy có 150 gia đình dùng bột giặt

OMO. Với độ tin cậy 95% hãy ước lượng tỷ lệ tối đa gia đình dùng bột giặt OMO.

Giải: Gọi f là tỷ lệ gia đình dùng bột giặt OMO trên mẫu.

Gọi p là tỷ lệ gia đình dùng bột giặt OMO trên đám đơng.

Vì n = 200 khá lớn nên f có phân phối xấp xỉ chuẩn: f - N(p,—). n

Tìm được ua sao cho P(-Ua < U) ® 1 - a

Thay biểu thức của u vào cơng thức trên và biến đổi ta có

Hay P(p < f +

Vì p chưa biết n = 200 khá lớn ta lấy p « f = 150/200 = 0,75.

Giả thiết cho 1 - a = 0,95 a = 0,05. Tra bảng ta có u005 = 1,65.

Thay số vào cơng thức trên ta có:

p < 0,75 + 10,75.025

200 .1,65 => p<0,8

Kếtluận: Với độ tin cậy 95% ta có thể nói rằng tỷ lệ tối đa gia

Một phần của tài liệu Giáo trình Lý thuyết xác suất và thống kê toán: Phần 2 - Mai Chi, Trần Doãn Phú (Trang 59 - 67)