Xét một đám đơng kích thước N, trong đó có M phần tử mang dấu hiệu
Ạ Kí hiệu tỉ lệ phần tử mang dấu hiệu A trên đám dõng là p = Để ước
lượng p từ đám đơng ta lấy ra mẫu kích thước n. Kí hiệu Ùa là số phần tử mang dấu hiệu A có trong n phần tử lấy rạ Khi đó f — —— là tỉ lệ phần tử
n
mang dấu hiệu A trên mẫụ Ta sẽ dùng f để ước lượng p. Khi n đủ lớn, theo
pq 9
mục 4.3.4, chương 4 thì f ~ N(p, —), ở đây ta kí hiệu q = 1 — p. Vì vậy, ta
n có: u = ~ 1V(O,1) (5.5) pq n 7->(|i7| < Ua) « 1 — a = 7 Thay biểu thức của u vào công thức trên, ta có:
P(l/-p|< 0 = 7 (5.6)
<=>(/ — e<p</ + e)«l — 0 = 7 Trong đó:
(5.7) là sai số của ước lượng. Nếu p chưa biết, n khá lớn để tính e ta lấy p « /và
q « 1 — /, khi đó:
.lí ạ 2
Khoảng tin cậy đối xứng của p là (/ — e; / + e). Độ tin cậy của ước lượng là 7 = 1 — ạ
ở đây cũng có ba bài tốn cần giải quyết như trong ước lượng kì vọng tốn của ĐLNN. Riêng bài tốn 3: (Bài tốn tìm kích thước mẫu), để có các cơng thức (5.5),(5.6),(5.7) ta phải giả thiết / có phân phối chuẩn. Sau đó từ (5\7),
ta tìm được:
PơUa
n = (5.8)
Đến đây có ba khả năng sau có thể xảy ra: 1) Biết p, ta tìm n theo cơng thức (5.8).
2) Chưa biết p, nhưng biết f, để tìm n trong cơng thức (5.8) ta thay
p « f, q « 1 - f.
P(p — e</<p + e) «1 — 0 = 7
Từ đó ta có khoảng tin cậy 1 — a của f là (p — e; p + e).
Chú ý 5.6 a) Từ f — e < p < f + e, thay p=~ và biến đổi ta có:
Nự - e) < M < N(f + e)
Từ đó ta có khoảng tin.cậy của M khi biết N là: (Nự — e); N(f + e)) b) Tương tự, từ p — e < f < p + e, thay / = — và biến đổi ta
n được:
n(p - e) < nA < n(p + e)
Từ đó ta có khoảng tin cậy của nA khi biết p là: (n(p — e); n(p + e))
Tương tự, ta có khoảng tin cậy của N khi biết M là , M M .
Ví dụ 5.6 Điều tra ngẫu nhiên 50 sinh viên năm thứ hai của trường ĐHTM
thấy có 12 sinh viên đạt điểm khá giỏi môn LTXS và TKT.
1) Với độ tin cậy 95% hãy ước lượng tỉ lệ sinh viên đạt điểm khá giỏi mơn LTXS và TKT trong tồn trường.
2) Với độ tin cậy 95% hãy ước lượng số sinh viên năm thứ hai của trưòng đạt điểm khá giỏi môn LTXS và TKT. Biết số sinh viên năm thứ hai của trường là 2000 sinh viên.
3) Để đảm bảo khi ước lượng đạt độ tin cậy 99% và sai số khơng vượt q
0,1 thì cần điều tra bao nhiêu sinh viên?
Lời giảị Gọi f là tỉ lệ sinh viên đạt điểm khá giỏi trên mẫụ
Gọi p là tỉ lệ sinh viên đạt điểm khá giỏi trẽn đám đơng. 1) Vì n — 50 khá lớn nên:
f ~ N(p, =
n
f -p v(o,1)
Khi đó ta tìm được Us. sao cho:2
P(|Ỉ7| < Uä) ~ 1 — a = 7 Thay biểu thức của u vào cơng thức trên, ta có:
p(\f
P(f — 6<p</ + e)~l — a = 7
Trong đó: 6 =
7 = 1 — a - 0, 95, nên lia = u0,025 — 1, 96. Suy ra:
118
Vậy khoảng tin cậy củap là: (0,24—0,118; 0, 24+0,118) hay (0,122; 0,358)
Kết luận: Với độ tin cậy 95% có thể nói rằng tỉ lệ sinh viên đạt điểm khá
giỏi môn LTXS và TKT nằm trong khoảng từ 12,2% đến 35, 8%. 2) Theo câu 1), ta có: 0,122 < p < 0,358.
Thay p= 77 và Ar = 2000 ta được: 244 < M < 716.
Kết luận-. Với Với độ tin cậy 95% có thể nói rằng số sinh viên năm thứ
hai đạt điểm khá giỏi môn LTXS và TKT nằm trong khoảng từ 244 đến 716 sinh viên.
2 PQ
3) Giả thiết f có phân phối chuẩn, ta có: f N(p^Ỵ Khi đó:
n
u = t—-~7V(0,l)
_ ,. , , Ịpq _ pq.Uị
Tứơng tự trong câu 1), ta có: 6 = — Suy ra: n = —T-2-
y n 2
Vì p chưa biết, ta lấy p ~ f = 0,24; q « 0,76 có trong mẫu của câu 1).
7 = 1 — a = 0,99 =>■ U& = 1/0,005 - 2 , 58
Do vậy:
0,24.0,76(2,58/
(0,1/ - 121,4
Kết luận: Để đảm bảo khi ước lượng đạt độ tin cậy là 99% và sai số
khơng vượt q 0,1 thì cần điều tra ít nhất 122 sinh viên.
b. Khoảng tin cậy phải (lấy Oi = 0, Ơ2 = Oí dùng để ước lượng giá trị tối
thiểu của p).
Ta vẫn dùng thống kê (5.5). Với độ tin cậy 7 = 1 — 0 cho trước ta tìm được
ua sao cho:
P(U < Ua) «1—0=7
Từ (5.5), ta có:
VI p chưa biết, n lớn ta lấy p « /. Ta có khoảng tin cậy phải của p là: /(!-/)
c. Khoảng tin cậy trái (lấy Ck! = a, a2 = 0 dùng để ước lượng giá trị tối đa
của p).
Ta vẫn dùng thống kê (5.5). Với độ tin cậy 7 = 1 — a cho trước ta tìm được
ua sao cho:
P(—Ua <[7)~1 — 0 = 7
Từ (5.5), ta có:
P(-Ua < a = 7
<=> P(p < f + 1 — a - 7
Vì p chưa biết, n lớn ta lấy p « f. Ta có khoảng tin cậy trái của p là:
(-oo;/ + •ưQ)
Ví dụ 5.7 Khám 100 trẻ dưới một tuổi ở một huyện ngoại thành thấy có 18
em suy dinh dưỡng. Với độ tin cậy 99% hãy ước lượng tỉ lệ tối thiểu trẻ em dưới một tuổi suy dinh dưỡng ở huyện trên.
Lời giảị Gọi f là tỉ lệ trẻ em suy dinh dưỡng trên mẫụ
Gọi p là tỉ lệ trẻ em suy dinh dưỡng trẽn đám đơng. Vì TI = 200 khá lớn nên f có phân phối xấp xỉ chuẩn:
f-p
Ta tìm được ua sao cho:
P(U < ua) « 1 — a — 7
Thay biểu thức của u vào cơng thức trên, ta có:
P(J -p< \ « 1 - a = 7
Vì p chưa biết, n khá lớn ta lấy p « f = 0,18; q « 0,82; ua = uOfii = 2,33. Vậy khoảng tin cậy phải của p là:
(0,18 -
Kết luận-. Với độ tin cậy 99% ta có thể nói rằng tỉ lệ tối thiểu trẻ em suy
dinh dưỡng ở huyện trên là 9%.
5.5 Ước lượng phương sai của ĐLNN phân
phối chuẩn
Giả sử ta cần nghiên cứu một dấu hiệu X có phân phối chuẩn vdi Var(X) = cr2 chưa biết. Để ước lượng ớ2, từ đám đông ta lấy ra mẫu w — (X1,X2)... ,Xn) Từ mẫu này ta tìm được s'2. Theo (4.4), ta có:
X2 = (" ~ x2(“-‘> (5.9)
ạ Khoảng tin cậy của ơ2 (lấy ƠI = a2 = —
Vì X2 ~ x2^-1), với độ tin cậy 7 — 1 — a cho trước, ta có thể tìm được
phân vị Xi_s và xã sao cho:
1 2 2
2(n-l) . 2 2(n—1)\ __ 1 _______
PvXi-ị <x <xị ) = 1 - ot = 7
Thay biểu thức của X2 vào cơng thức trên và biển đổi, ta có:
ơ đây 7 = 1 — a là độ tin cậỵ
-2 ,^(’n - 1)S'2. (n - 1)S'2\ Khoảng tin cậy của <72 là (----2(n_zx) ; —2-(-_zx) }.
ỵị Xi-ậ
Ví dụ 5.8 Bắn 20 viên đạn pháo vào một mục tiêu và tính được phương sai
mẫu điều chỉnh của khoảng cách từ điểm rơi của viên đạn đến mục tiêu là 72m2. Với độ tin cậy 99% hãy ước lượng phương sai của khoảng cách từ điểm
rơi của viên đạn đến mục tiêụ Biết khoảng cách từ điểm rơi của viên đạn đến mục tiêu là ĐLNN phân phối chuẩn.
Lời giảị Gọi X là khoảng cách từ điểm rơi của viên đạn đến mục tiêụ
2 r, (n — l)s'2
Vì X có phân phối chuẩn nên X2 = ------~ ỵ2(n_1\ Do đó ta tìm
được và Xọ’1'1* sao cho:
2 2
< X2 < xị(n 1}) = 1 - a = 7
2
Thay biểu thức của X2 vào công thức trẽn và biển đổi, ta có:
Tra bảng, ta có: = xẫSs = 38,5822; = xSÌ = 6,84398.
Vậy khoảng tin cậy của ơ2 là (38^5322 ’ 6*84393) hay (35,46; 199,88)
b. Khoảng tin cậy phải của ơ2 (lấy »1 = 0, a2 = a dùng để ước lượng giá trị tối thiểu của ơ2)
Ta vẫn dùng thống kê (5.9). Với 7 = 1 — a cho trước ta tìm được phân vị
Thay biểu thức của X2 từ (5-9) vào công thức trên và biển đổi, ta có: Xa" sao cho:
P(x2<X2(n-1)) = l-« = 7
p/(n-l)S'2
\ 2(n—1) < CT2) - 1 — a = 7
Vậy khoảng tin cậy phải của <T2 là: z(n-l)5'2.
1 2(n-l) ’
Xa
+00)
c. Khoảng tin cậy trái của ơ2 (lấy «1 = a, a2 — 0 dùng để ước lượng giá
trị tối đa của <T2)
Ta vẫn dùng thống kê (5.9). Với 7 = 1 — a cho trước ta tìm được phân vị XbX1) sao cho:
Thay biểu thức của X2 từ (5.9) vào công thức trên và biển đổi, ta có:
p(ơ2< 1 — a = 7
Vậy khoảng tin cậy phải của ơ2 là:
_ (n- 1)S'2
-°°i 2(n-i)
Xl-a
Ví dụ 5.9 Theo dõi giá cổ phiếu của HAP (Cơng ty giấy Hải Phịng) trong
15 phiên giao dịch và tính được phương sai mẫu điều chỉnh là 8000 (đồng)2. Với độ tin cậy 90% hãy ước lượng phương sai tối thiểu của giá cỗ phiếu của HAP. Biết giá cổ phiếu của HAP là một ĐLNN phân phối chuẩn.
Lời giảị Gọi X là giá cổ phiếu của HAP.
(n — lis'2
Vì X có phân phối chuẩn nên X2 =------5----- ~ x2(n_1)
_ <T2
Ta tìm được phân vị Xa n_1) sao cho:
p(x2 < xẳ(n x)) = 1 - a = 7
Thay biểu thức của X2 vào công thức trên và biển đổi, ta có: (n - l)s'2
< o-2) = 1 - a = 7
Tra bảng, ta được: Xa n_1) = xổj14) = 21,0642.
Vậy khoảng tin cậy trái của ơ2 là: (21 0642 ’ +°°) hay(5317; +00)
Kết luận-. Với độ tin cậy 90% có thể nói rằng phương sai tối thiểu của giá cổ
phiếu của HAP là 5317 (đồng)2.
Bài tập chương 5
Ước lượng điểm
5.1 Muốn ước lượng điểm doanh thu trung bình của một cửa hàng ta làm
5.2 Muốn ưóc lượng điểm phương sai của giá bán lẻ của một loại hàng hóa ta làm thế nàỏ
5.3 Muốn ước lượng điểm tỉ lệ phế phẩm của một lơ hàng hóa ta làm thế
nàỏ
5.4 Cân thử 50 gói hàng do một máy đóng gói tự động đóng được kết quả:
Trọng lượng (gam) 496 497 498 499 500
Số gói 6 10 20 9 5
Hãy dùng phương pháp ước lượng điểm để ước lượng trọng lượng trung bình và phương sai của trọng lượng gói hàng do máy đóng.
5.5 Một hình trịn có bán kính p và diện tích là TTp2. Như ta đã biết đo bán
kính hình trịn là một việc rất khó. Hai nhà thống kê đo bán kính của hình trịn này một cách độc lập và được kết quả là Xi và x2. Biết E(X1) = E(x2) — p.
ạ ___ X1 + x2r = ~2 có phải là ước lượng không chệch của p hay không?
b. 7rr2 có phải là ước lượng khơng chệch của Tĩp2 hay khơng?
c. 1Ĩ.X2 + Tĩ.xị 2 hay khơng?
có phải là ước lượng khơng chệch của diện tích hình trịn
Gợi ý: Sử dụng công thức: Var(x) = E(x2} — E2(X).
5.6 Hai người cùng ước lượng một cách độc lập thời hạn sử dụng của một
loại thuốc mơị Người thứ nhất kiểm tra 25 gói và tính được thời hạn sử dụng trung bình là Người thứ hai kiểm tra 100 gói và tính được thời hạn sử dụng trung bình là x2. Biết kết quả đo thòi hạn sử dụng của mỗi gói thuốc tương ứng của người thứ nhất và người thứ hai X1, x2 đều là những ước lượng khơng chệch của thời hạn sử dụng trung bình của loại thuốc trên. Và do ngưòi
■ 9
ạ Để kết hợp kết quả của hai người trên ta có thể đưa ra những ước lượng sau: = Ịx. + ịx, Ớ2 = 2^1 + 3X2 Ớ3 3— 2— = + ịx2 0 □ Ớ4 = |xi + |x2 □ 0
Trong các ước lượng trên, những ước lượng nào là ước lượng không chệch, ước lượng nào là ước lượng tốt nhất?
b. Trong lớp các ước lượng sau: ỡ = ữiXỵ +a2X2, tìm Oi và a2 để ớ là ước lượng khơng chệch có phương sai nhỏ nhất.
5.7 Để ước lượng E(X) = /z ta lấy mẫu ngẫu nhiên w = (Xj, x2,... ,xnỵ
Với giá trị nào của Otị(i = 1,2,..., n) thì: 0 = 01X1 + a2X2 + ... + anXn là ước lượng:
ạ Khơng chệch của ịíĩ
b. Tốt nhất của ịíì
Gợi ý: Để giải câu b. dùng bất đẳng thức Bunhiacovskị
Ước lượng bằng khoảng tin cậy
ước lượng kì vọng tốn của DLNN
5.8 Chạy thử 9 lần một loại xe ôtô đua mới sản xuất tính được lượng xăng
tiêu thụ trung bình trên 100 km là 13,2 lít. Với độ tin cậy 99% hãy ước lượng lượng xăng tiêu thụ trung bình trên 100 km của loại xe trên. Biết lượng xăng tiêu thụ của xe trên 100 km là một ĐLNN tuân theo quy luật phân phối chuẩn với độ lệch tiêu chuẩn là 2,5 lít.
5.9 Biết tuổi thọ của người dân là một ĐLNN phân phối chuẩn với độ lệch
của mỗi người là 76 năm. Với độ tin cây 95% hãy ước lượng tuổi thọ trung bình tối đa của người dân.
5.10 Để ước lượng tiền gửi của khách hàng vào một ngân hàng, theo dõi 16 khách hàng và tính được số tiền gửi trung bình của mỗi khách hàng là 25 triệu đồng. Với độ tin cậy 99% hãy ước lượng số tiền gửi trung bình tối thiểu của khách hàng vào ngân hàng. Biết số tiền gửi của khách hàng vào ngân hàng là một ĐLNN phân phối chuẩn với độ lệch tiêu chuẩn là 10 triệu đồng.
5.11 Tuổi thọ bóng đèn nê-ơng do nhà máy Điện Quang sản xuất là một ĐLNN phân phối chuẩn với độ lệch tiêu chuẩn là 60 giờ. Kiểm tra ngẫu nhiên 16 bóng thấy tuổi thọ trung bình của mỗi bóng là 4380 giờ. Với độ tin cậy 99% bằng khoảng tin cậy đối xứng hãy ước lượng tuổi thọ trung bình của bóng đèn nê-ơng do nhà máy sản xuất.
5.12 Để xác định số vốn vay ngân hàng trung bình của một trang trại người ta dùng phương pháp điều tra chọn mẫụ Nếu yêu cầu sai lệch giữa trung bình mẫu và trung bình đám đơng không vượt quá 10 triệu đồng vdi độ tin cậy 95% thì cần điều tra bao nhiêu trang trạị Biết số vốn vay ngân hàng của các trang trại là một ĐLNN phân phối chuẩn với độ lệch tiêu chuẩn là 35 triệu đồng.
5.13 Biết trọng lượng của các gói hàng do một máy tự động đóng là một ĐLNN phân phối chuẩn với trọng lượng trung bình là 1000 gam và độ lệch tiêu chuẩn là 2 gam. Với độ tin cậy 95% có thể nói gì về trọng lượng trung bình của 25 gói hàng lấy ra một cách ngẫu nhiên?
5.14 Thời gian cần thiết để sản xuất ra một loại sản phẩm là một ĐLNN phân phối chuẩn với kì vọng tốn là 12 phút và phương sai là 4 (phút)2. Với độ tin cậy là bao nhiêu để có thể nói rằng thời gian trung bình để sản xuất ra 25 sản phẩm nằm trong khoảng từ 11 phút đến 13 phút?
5.15 Khám sức khỏe ngẫu nhiên cho 49 sinh viên năm thứ nhất, thấy chiều cao trung bình của mỗi sinh viên là 172 cm và phương sai mẫu điều chỉnh về chiều cao là 100 (cm)2. Với độ tin cậy 95% bằng khoảng tin cậy đối xứng hãy ước lượng chiều cao trung bình của sinh viên năm thứ nhất.
5.16 Một sinh viên theo dõi 36 lần thời gian đi từ nhà mình đến trường và tính được thời gian trung bình cho một lần là 35 phút, phương sai mẫu điều
chỉnh là 25 (phút)2. Nếu nói rằng thời gian trung bình cần thiết để đi từ nhà đến trường nằm trong khoảng từ 33 phút đến 37 phút thì độ tin cậy đạt được là bao nhiêủ
5.17 Cân khám sức khỏe cho 40 sinh viên năm thứ nhất trường ĐHTM tính được độ lệch tiêu chuẩn mẫu điều chỉnh về trọng lượng là 10 kg. Để bảo đảm khi ước lượng trọng lượng trung bình của tồn bộ số sinh viên năm thứ nhất của trường với độ tin cậy 99% và sai số khơng vượt q 2 kg thì cần cân ngẫu nhiên thêm bao nhiêu sinh viên nữả
5.18 Theo dõi 100 doanh nghiệp tư nhân, thấy vốn điều lệ đăng ký trung bình là 1200 triệu đồng và độ lệch tiêu chuẩn mẫu điều chỉnh về vốn điều lệ đăng ký là 80 triệu đồng. Với độ tin cậy 95% hãy ước lượng vốn điều lệ đăng ký trung bình tối thiểu của các doanh nghiệp tư nhân.
5.19 Theo dõi 36 công nhân cùng sản xuất ra một loại sản phẩm và thu được