Khái niệm về ước lượng bằng khoảng tin cậỵ

Một phần của tài liệu Xác suất và thống kê toán: Hướng dẫn giải bài tập - Phần 1 (Trang 77)

cậy

Để ước lượng tham số ỡ của ĐLNN X trước hết từ đám đông ta lấy ra mẫu ngẫu nhiên w = (Xj, x2, ■.., xn).

Tiếp đến ta xây dựng thống kẽ G = /(X1, x2, • • •, Xn, ớ), sao cho quy luật phân phối xác suất của G hồn tồn xác định (khơng phụ thuộc vào tham số ớ). Với xác suất 7 = 1 — a cho trước ta xác định cặp giá trị <21, a2 thỏa mãn các điều kiện <21 > 0, a2 > 0 và <21 + <22 = <2- Vì quy luật phân phối xác suất của G đã biết, ta tìm được phân vị gi-Q1 và gữĩ sao cho:

P(G > ỡi-ai) = 1 - ai và P(G > ga2) = a2

Khi đó: P(gi-ai <G < ga2) = l-<21-<22 = l- a = 7. Cuối cùng bằng biến đổi tương đương, ta có:

P(0ĩ < ớ < 0;) = 1 — a = 7 Trong đó:

• 7 = 1 — a được gọi là độ tin cậy

• (#í, 02) được gọi là khoảng tin cậy

• I = (02 — ỡỵ) được gọi là độ dài của khoảng tin cậy

ta thường chọn Oi = <72 = £■• Nếu chọn Q'! =0 vàữ2 =a hoặc chọn

Oiỵ = a và a2 = 0 thì ta sẽ có khoảng tin cậy một phía (dùng để ước lượng

giá trị tối thiểu hoặc giá trị tối đa của ớ). Sau đây ta dùng phương pháp ước lượng khoảng để ước lượng các tham số của ĐLNN.

5.3 Ước lượng kì vọng tốn của ĐLNN

Để ước lượng kì vọng toán E(X) = ụ, của ĐLNN X, từ đám đông ta lấy ra mẫu ngẫu nhiên w = (Xl,X2,..., Xn). Từ mẫu này ta tìm được trung bình mẫu X và phương sai mẫu điều chỉnh s'2. Ta sẽ ước lượng p. thông qua X. Xét các trường hợp sau:

5.3.1 ĐLNN X phân phối theo quy luật chuẩn với ơ2 đã biết

V1 X ~ N(ụ, ơ2) nên X ~ N(ji, —), khi đó:

n

í/ = ^£^~7V(0,l) (5.1)

ỵ/n

Khoảng tin cậy đối xứng (lấy ữỊ — a2 — y)

Với độ tin cây 7 = 1 — a cho trước, ta tìm được phân vị chuẩn Us, sao cho: P(|Ỉ7| < U|) = 1 — a = 7

Thay biểu thức của u từ (5.1) vào cơng thức trên, ta có:

P(|X-/z| < = 1 - a = 7 (5.2)

y/n 2

Trong đó:

e = —7=tza là sai số ước lượng

y/n 2

7 = 1 — a là độ tin cậy

{X — e,x + e) là khoảng tin cậy ngẫu nhiên của ịi

(5.3)

Ở đây ta cần chú ý rằng ụ là một số xác định và với xác suất 1 — a khoảng tin cậy ngẫu nhiên chụp đúng ụ,.

Trong một lần lấy mẫu ta tìm được một giá trị cụ thể X của X. Khi đó ta có một khoảng tin cậy cụ thể của ụ, là (x — e; X + e).

Ta có những bài tốn sau:

Bài tốn 1: Biết kích thước mẫu n, biết độ tin cậy 7 = 1 — 0 tìm sai số 6 (hoặc khoảng tin cậy).

Vì biết độ tin cậy 7 = 1 — a tra bảng ta tìm được Uị từ đó tìm được sai

số € — -^=Uậ và độ tin cậỵ ỵ/n 2

Bài tốn 2: Biết kích thước mẫu n, biết sai số e tìm độ tin cậy 7.

Biết n và e thì từ cơng thức (5.3) ta tìm được Ua, tra bảng tìm được từ đó tìm được độ tin cậy 7 = 1 — 0.

Từ cơng thức tìm khoảng tin cậy ta thấy rằng sai số của ước lượng bằng một nửa độ dài của khoảng tin cậỵ Vì vậy nếu biết khoảng tin cậy đối xứng (a, 6) thì ta có thể tính được sai số của ước lượng theo cơng thức e = —

Bài tốn 3: Biết độ tin cậy y, biết sai số 6 tìm kích thước mẫu n.

ơ2ul - Biết 7 = 1 — a, ta tìm được uạ Từ (5.3) ta tìm được n = —Ỹ. Đó là kích thước mẫu tối thiểu cần tìm.

Chú ý 5.1 Nếu chưa biết cr, nhưng kích thước mẫu lớn (n > 30), ta có thể

thay ơ bằng ước lượng khơng chệch tốt nhất của nó là s'.

Chú ý 5.2 Trong trường hợp biết /z, cần ước lượng X, biến đổi tương đương

(5.2), ta có:

P(jj, — e < X </z + e) = 1 — 0 = 7

Vậy khoảng tin cậy của X là: (fj, — e; p. + e)

phân phối chuẩn với độ lệch tiêu chuẩn là 20 gam. Cân ngẫu nhiên 16 gói do máy đóng và tính được X = 997 gam.

1) Với độ tin cậy 99% hãy ước lượng trọng lượng trung bình của gói hàng

do máy đóng.

2) Nếu yêu cầu ước lượng trọng lượng trung bình của gói hàng đạt độ tin cậy 95% và sai số không vượt quá 5 gam thì cần cân thử bao nhiêu góỉ

Lời giảị

1) Gọi X là trọng lượng của gói hàng do máy đóng.

Gọi X là trọng lượng trung bình của gói hàng trên mẫụ Gọi ụ. là trọng lượng trung bình của gói hàng trên đám đơng.

0.2 Vì X có phân phối chuẩn nên X

n

Khi đó: u = ~ 7V(0,1)

x/ũ

Ta tìm được phân vị chuẩn Ui, sao cho:

P(|Ỉ7| < ưa) — 1 - a — 7 Thay biểu thức của u vào công thức trên, ta có:

P(|X -fỉ\< -J=uz) = 1 - a = 7

o P(x — €<ẶÍ<X + €) = 1 — a = 7

ơ

Trong đó: 6 = —7=ưạ

ỵ/n 2

Vì 1 — a — 0,99 => Uị = u0,005 = 2,58. Theo giả thiết, ta có: ơ = 20, n = 16. Vậy £ = —2=2,58 = 12,9

Khoảng tin cậy 0,99 của ụ, đối với mẫu cụ thể là (997 — 12,9; 997 + 12,9) hay (984,1;1009,9)

Kết luận: Với độ tin cậy 99% ta có thể nói rằng trọng lượng trung bình

của các gói hàng nằm trong khoảng (984, lgam; 1009,9gam).

ơ Ơ2ÚỈ

2) Theo câu 1) ta có: £ = => n = —2^-

y/n 2

Vậy để bảo đảm khi ước lượng đạt độ tin cậy 95% và sai số không vượt quá 5 gam thì cần điều tra một mẫu gồm ít nhất 62 gói hàng.

b. Khoảng tin cậy phải (lấy Oi — 0,02 — Ot, dùng để ước lượng giá trị tối

thiểu của /ì).

Ta vẫn dùng thống kê (5.1). Với độ tin cậy 7 = 1 — 0 cho trước ta tìm được phân vị chuẩn ua sao cho:

P(u < UQ) =1—0=7

Thay biểu thức của u từ (5.1) vào cơng thức trên, ta có:

P(X ơ M < UQ) = 1 - o = 7 y/ñ

<=> P(x---- y=ua </i) = l — 0 = 7

Như vậy, khoảng tin cậy phải với độ tin cậy 7 = 1 — a của fj, là:

c. Khoảng tin cậy trái (lấy Oi =0,02 = 0, dùng để ước lượng giá trị tối đa

của Ặí)

Ta cũng dùng thống kê (5.1). Với độ tin cậy 7 = 1 — 0 cho trước ta tìm được ua sao cho:

P(-Ua <U) = 1- 0 = 7

Thay biểu thức của u từ (5.1) vào công thức trên, ta có:

p(-ua < = 1-0 = 7

y/đ

<=> P(jl < X + ~/=ua) = 1-0 = 7

Ví dụ 5.3 Theo dõi doanh thu của một cửa hàng liên liếp trong 16 ngày và

tính được doanh thu trung bình một ngày là 18 triệụ Với độ tin cậy 99% hãy ước lượng doanh thu trung bình tối thiểu của cửa hàng. Biết doanh thu của cửa hàng có phân phối chuẩn với độ lệch tiêu chuẩn là 2 triệu đồng.

Lời giảị Gọi X là doanh thu của cửa hàng.

Gọi X là doanh thu trung bình của cửa hàng trên mẫụ

Gọi ụ. là doanh thu trung bình của cửa hàng trên đám đơng. Vì X có phân

2

phối chuẩn nên X ~ N(fi, —), khi đó:

n

y/n

Ta tìm được phân vị chuẩn ua, sao cho:

p(ư < Ua) — 1 — a = 7

o P(X---- y=ua < = 1 — a = "Ỵ

Vì 1 — a = 0,99 => ua — Uọoi = 2,33. Ta có khoảng tin cậy phải 99% của 2

ỊJ, là: (18 — ^.2,33; +oo) hay (16, 835; +oo).

Vậy với độ tin cậy 99% ta có thể nói rằng doanh thu trung bình tối thiểu của cửa hàng là 16,835 triệu đồng.

5.3.2 ĐLNN X phân phối theo quy luật chuẩn với ơ2 chưa biết

Vì X có phân phối chuẩn nên:

‘ ~ T(n-1)

S' 2 y/n

ạ Khoảng tin cậy đối xứng (lấy Oi = a2 — —)

Với độ tin cậy 7 = 1 — a cho trước ta tìm được phân vị sao cho: P(|T| < 4n_1)) = 1 - a = 7

Thay biểu thức của T vào cơng thức trên, ta có:

P(|X - /z| < Ặ4n_1)) = 1-0 = 7

y/n 2

P(X — 6<^<x + e) = l — 0 = 7

Trong đó:

sl

6 = là sai số của ước lượng ,

yời 2

7 = 1 — a là độ tin cậy ,

(X — e < fi < X + e) là khoảng tin cậy ngẫu nhiên của fỉ.

ở đây cũng có ba bài toán cần giải quyết như trong mục 5.3.1. Riêng bài tốn 3 (bài tốn xác định kích thước mẫu) ta sẽ giải quyết bằng phương pháp

mẫu kép như sau:

Bước 1-. Điều tra một mẫu sơ bộ kích thước k khơng lớn lắm:

= (ẤLẤ2,.... xk)

Từ mẫu này ta tính được X = — 52 Xi và s'2 = -—- 52C^i — X)2.

k i=i k — 1 j=i

Bước 2: Giả sử mầu cần tìm có kích thước là n: w2 = (X1, x2ì..., Xn), ta

có: 1 " „ Ẽ M T — n i=1 ~ T(fc-1) S' ỵ/n

Vì vậy có thể tìm được phân vị tí-1) sao cho: P(|T|<íJ-1)) = l-o = 7

Thay biểu thức của T vào công thức trên và biến đổi, ta được:

Sai số của ước lượng sẽ là: e = —7=ta-1), suy ra TI = —ta-1 • Đó chính

y/n 2 L e 2 J

là giá trị tối thiểu của kích thước mẫu cần tìm.

Ta cần chú ý rằng, trong thực hành, vì đã có mẫu sơ bộ kích thước k nên chỉ cần điều tra thêm mẫu kích thước n — k là đủ.

b. Khoảng tin cậy phải (lấy Oi — 0, a2 — a dùng để ước lượng giá trị tối

thiểu của jiz).

Vẫn dùng thống kê (5.4) với độ tin cậy 7 = 1 — a cho trước, tìm ta"-1) sao cho:

P(T < t^"-1)) = 1 - a = 7

Thay biểu thức T từ (5.4) vào cơng thức trên, ta có: p(^_Íỉ<e-1)) = 1_Q = 7

y/n

& P(X - -^t^"-1) < /z) = 1 - a = 7

Ta có khoảng tin cậy phải của p, là:

c. Khoảng tin cậy trái (lấy ƠI = a, ơ2 = 0 dùng để ước lượng giá trị tối đa

của ¡ì)

Vẫn dùng thống kê (5.4) với độ tin cậy 7=1 — 0 cho trước, tìm ta"-1) sao cho: Pí-t^"-1) < T) = 1 - a = 7

Thay biểu thức T từ (5.4) vào cơng thức trên, ta có:

P(-t£-V <^^) = 1-0 = 7 y/ũ

&p(fi<x + = 1 - a = 7

y/n

Ta có khoảng tin cậy trái của ụ, là:

(-00; X + -^=t£"-1))

y/ Tl

Chú ý 5.3 Khi n > 30, tuy vẫn có thể dùng thống kê (5.4) song người ta

thường dùng thống kê (5.1) và lấy ơ « s' (s' là ước lượng khơng chệch tốt nhất của ơ).

Ví dụ 5.4 Chiều cao của nam thanh niên ở một địa phương là một ĐLNN

phân phối chuẩn. Điều tra 25 nam thanh niên ở địa phương đó và tính được chiều cao trung bình của mỗi thanh niên là 169 cm, độ lệch tiêu chuẩn mẫu điều chỉnh về chiều cao là 10 cm.

1) Với độ tin cậy là 95% hãy ước lượng chiều cao trung bình tối đa của nam thanh niên ở địa phương trên.

2) Để đảm bảo khi ước lượng chiều cao trung bình của nam thanh niên ở

địa phương trên đạt độ tin cậy 99% và sai số khơng vượt q 3 cm thì cần điều tra bao nhiêu ngườỉ

Lời giảị

1) Gọi X là chiều cao của thanh niên ở địa phương.

Gọi X là chiều cao trung bình của thanh niên trên mẫụ Gọi ụ, là chiều cao trung bình của thanh niên trên đám đơng. Vì X có phân phối chuẩn nên:

X-ụ S^_ y/n

~ T(n_1)

Ta tìm được t^a sao cho:

Thay biểu thức của T vào cơng thức trên, ta có: /’(-e_1) <^/) = l-a = 7

y/n

&P(ji<X + 4=^n_1)) = 1 - ct = 7

yn

Kết luận: Với độ tin cậy 95% có thể nói rằng chiều cao trung bình tối đa

của thanh niên địa- phương đó là 172,442 cm.

2) Ta coi mẫu ở đầu bài đã cho là mẫu sơ bộ kích thước k — 25 :

= (X1,X2,...,Xfc)

Từ mẫu sơ bộ này ta tính được:

x = ị ¿Xi và s'2 - -Ị- Ề(Xx - X)2 K i=l K — i j=i

Giả sử mẫu cần tìm có kích thước n :W2 — (X1, x2,..., Xn)

1 n

Xét thống kê T = —i 1 g,------ ựn

Vì X có phân phối chuẩn nên T ~ Vì vậy, ta có thể tìm được

í í-1) sao cho: 2 P(|T| < 4fc_1)) = 1 - a = 7 2 Ề - d < = 1 - a = 7 lni=1 I y/n 2 Ta có: 6 = _1) =* n = (—íậ_1))2 = (^?2,797)2 « 86,92. y/n 2 e 2 3

Kết luận: Để đảm bảo khi ước lượng đạt độ tin cậy 99% và sai số là 3

5.3.3 Chưa biết quy luật phân phối xác suất của X nhưng kích thước mẫu TI > 30

2

Theo mục 2 § chương 4, khi TI > 30 thì X ~ 7V(/Z, —). Do đó ta sử dụng

n

thống kê:

Các phần còn lại giải quyết tương tự như trong mục 5.3.1.

Chú ý 5.4 - Riêng đối với bài toán ước lượng kích thước mẫu, vì chưa biết

quy luật phân phối xác suất của X nên phải giả thiết X có phân phối chuẩn.

- Nếu chưa biết ơ, vì n lớn nên, ta có thể lấy ơ « s'

Ví dụ 5.5 Phỏng vấn 40 khách du lịch nước ngoài thăm Huế, người ta thấy

thời gian lưu lại Huế trung bình của mỗi người là 1,9 ngày và phương sai mẫu điều chỉnh là 1,5 (ngày)2.

1) Với độ tin cậy 99% hãy ước lượng thời gian lưu lại Huế trung bình tối

thiểu của một khách du lịch nước ngồị

2) Để đảm bảo khi ước lượng đạt độ tin cậy 99% và sai số không vượt quá

0,3 ngày thì cần phải phỏng vấn bao nhiêu khách du lịch.

Lời giảị

1) Gọi X là thời gian lưu lại Huế của khách du lịch nước ngoàị

Gọi X là thời gian lưu lại Huế trung bình của một khách trên mẫụ Gọi /J, là thời gian lưu lại Huế trung bình của một khách trên đám đơng. Vì n = 40 > 30 nên X có phân phối xấp xỉ chuẩn:

— (72

n

Vậy ta có thể tìm được ua sao cho:

P(U < ua) = 1 — 0 = 7

Thay biểu thức của ư vào công thức trên và biến đối tương đương, ta có:

P(x---- -ý=ua <ịì) — 1 — a — -y y/n

Vì ơ chưa biết, kích thước mẫu lớn nên ta lấy ơ « s' = y/1,5 « 1,225 và ta có ua = 1/0,01 = 2,33.

1 225

Vậy khoảng tin cậy phải của ịi là (1,9—^=-.2,33; +oo) hay (1,45; +oo). y40

Kết luận: Với dộ tin cậy 99% ta có thể nói rằng thời gian lưu lại Huế

trung bình tối thiểu của một khách du lịch nước ngoài là 1,45 ngàỵ

2) Giả thiết X có phân phối chuẩn: X

Khi đó : _

ư = ~ W(O, 1)

y/rĩ

Ta tìm được 1/a sao cho:

P(|í/| < ĩ/a) = 1 - a = 7

m ơ /<7x2

Ta có: € = —¡= => n = (—lia) .

ỵ/n ĩ \e 2/

Vì ơ chưa biết, ta lấy ơ « s' — 1,225(có trong mẫu của câu 1). Mặt khác

ĩ/a = 1/0,005 — 2, 58. Do đó:

n = (ỉ^.2,58)2 = 110,98

Kết luận: Để đảm bảo khi ước lượng đạt độ tin cậy 99% và sai số không

5.4 ước lượng tỉ lệ (ước lượng tham số p trong phân phối ĂpỴ)

Xét một đám đơng kích thước N, trong đó có M phần tử mang dấu hiệu

Ạ Kí hiệu tỉ lệ phần tử mang dấu hiệu A trên đám dõng là p = Để ước

lượng p từ đám đơng ta lấy ra mẫu kích thước n. Kí hiệu Ùa là số phần tử mang dấu hiệu A có trong n phần tử lấy rạ Khi đó f — —— là tỉ lệ phần tử

n

mang dấu hiệu A trên mẫụ Ta sẽ dùng f để ước lượng p. Khi n đủ lớn, theo

pq 9

mục 4.3.4, chương 4 thì f ~ N(p, —), ở đây ta kí hiệu q = 1 — p. Vì vậy, ta

n có: u = ~ 1V(O,1) (5.5) pq n 7->(|i7| < Ua) « 1 — a = 7 Thay biểu thức của u vào cơng thức trên, ta có:

P(l/-p|< 0 = 7 (5.6)

<=>(/ — e<p</ + e)«l — 0 = 7 Trong đó:

(5.7) là sai số của ước lượng. Nếu p chưa biết, n khá lớn để tính e ta lấy p « /và

q « 1 — /, khi đó:

.lí ạ 2

Khoảng tin cậy đối xứng của p là (/ — e; / + e). Độ tin cậy của ước lượng là 7 = 1 — ạ

ở đây cũng có ba bài tốn cần giải quyết như trong ước lượng kì vọng tốn của ĐLNN. Riêng bài tốn 3: (Bài tốn tìm kích thước mẫu), để có các cơng thức (5.5),(5.6),(5.7) ta phải giả thiết / có phân phối chuẩn. Sau đó từ (5\7),

ta tìm được:

PơUa

n = (5.8)

Đến đây có ba khả năng sau có thể xảy ra: 1) Biết p, ta tìm n theo cơng thức (5.8).

2) Chưa biết p, nhưng biết f, để tìm n trong cơng thức (5.8) ta thay

p « f, q « 1 - f.

P(p — e</<p + e) «1 — 0 = 7

Từ đó ta có khoảng tin cậy 1 — a của f là (p — e; p + e).

Chú ý 5.6 a) Từ f — e < p < f + e, thay p=~ và biến đổi ta có:

Nự - e) < M < N(f + e)

Từ đó ta có khoảng tin.cậy của M khi biết N là: (Nự — e); N(f + e)) b) Tương tự, từ p — e < f < p + e, thay / = — và biến đổi ta

Một phần của tài liệu Xác suất và thống kê toán: Hướng dẫn giải bài tập - Phần 1 (Trang 77)

Tải bản đầy đủ (PDF)

(106 trang)