§2 PHƯƠNG PHÁP ƯỚC LƯỢNG
BẰNG KHOẢNG TIN CẬY
2.1 Khai niệm
Phương pháp ước lượng điểm nói trên có một nhược điểm
cơ bản là khi kích thước mẫu nhỏ thì ước lượng điểm tìm được có thể sai lệch rất nhiều so với giá trị của tham số cần
tốc lượng, tức là sai số của ước lượng có thể rất lớn Mặt khác dàng các phương pháp trên không thể đánh giá được khả
năng mắc sai lầm khi ước lượng bằng bao nhiêu Do đó khi kích thước mẫu nhỏ người ta thường sử dụng phương pháp
ước lượng bằng khoảng tin cậy
Để ước lượng tham số 6 của biến ngẫu nhiên gốc X trong tổng thể, phương pháp này chủ trương từ một thống kê G nào
đó của mẫu xây dựng một khoảng gia tri (G,, G,) sao cho véi
một xác suất cho trước tham số 0 sẽ rơi vào khoang (G,, G,)
đó Chú ý rằng do G là biến ngẫu nhiên nên khoang (G,, G,) cũng là một khoảng ngẫu nhiên, còn 9 lại là một số xác định
nên phải nói chính xác hon là khoảng (G;, G;) sẽ chứa đựng
giá trị Ð với một xác suất cho trước Từ đó ta có định nghĩa
Sau:
Dinh nghia Khodng (G,, G,) cia théng ké G duoc gọi là khodng tin cdy cla tham 866 néu véi xác suất bằng (1 ~ œ) cho trước thỏa mãn điêu biện
Trang 2
xác suất (1 — ơ) được gọi là độ tin cậy của ước lượng, còn
1=(G¿- Gì) được gọi là độ đài khoảng tin cậy
Như vậy, vấn để chủ yếu của phương pháp ước lượng bằng khoảng tin cậy là làm thế nào để xác định được khoảng
tin cậy (G,, G,) théa man (7.6) Dé lam điểu đó người ta tiến
hành như sau:
Từ tổng thể lập mẫu ngẫu nhiên kích thước n:
W=€Œ, X¿, X)
và từ đó xây dựng thống kê G = fŒ;, Xọ, , XL, 6) sao cho quy
luật phân phối xác suất của G không phụ thuộc vào các đối
số của nó và hoàn toàn xác định Lúc đó với độ tin cậy bằng
(1 — œ) cho trước có thể tìm được cặp giá trị ơy và dạ sao cho
a, + œạ = œ và tương ứng với chúng tìm được cặp gia tri go, và
gơ; thỏa mãn điều kiện
P(G < ga,) = a, (7.72)
va P(G > ga.) = a, (7.8)
Tw (7.7) va (7.8) suy ra
PŒœ; < G < gœ¿) = 1 ~ (œ + dạ) = 1 ~ œ (7.9) Như vậy, với độ tín cậy 1 - œ ta xây dựng được khoảng
tin cậy (gœ, gơa) cho G Bằng các phép biến đổi tương đương
bao giờ cũng có thể đưa (7.9) về dạng biểu thức tưởng đương
PIG, <9<G)=1l-a
Đó chính là khoảng tin cậy cần tìm,
Trong thực tế thường yêu cầu dé tin cay (1 - a) khá lớn
(chẳng bạn 1 ~ ơ = 0,95) nên theo nguyên lý xác suất lớn biến
cố (G¡ <8 < G¿) hầu như chắc chắn sẽ xảy ra trong một phép
Trang 3
X;, ., X,) ta thu duge một mẫu cụ thể w = (\, X¿, , x„) do đó
tinh dude gid tri cha G, va G, ứng với mẫu cụ thể này, ký
hiệu là g và gạ Lúc đó có thể kết luận là: Qua mẫu cụ thể với
độ tín cậy (1 - œ) tham số 6 của biến ngẫu nhiên gốc ÄX sẽ nằm trong khoảng (gị, g„) tức là (g, < 8 < Bi)
Phương pháp ước lượng bằng khoảng tin cậy khắc phục
được các nhược điểm của phương pháp ước lượng điểm
Chẳng những nó làm tăng độ chính xác của ước lượng mà cồn đánh giá được mức độ tin sậy của ước lượng đó nữa Tuy
nhiên nó cũng chứa đựng khả năng mắc sai lầm bằng œ
Dưới đây sẽ áp đụng phương pháp này để ước lượng một
vài tham số đặc trưng cơ bản của biến ngẫu nhiên X trong
tổng thể
2.3 Ước lượng kỳ vọng toán của biến ngấu nhiên
phân phối theo quy luật chuẩn
Giả sử trong tổng thể biến ngẫu nhiên gốc X phân phối
chuẩn N(u, ø?) nhưng chưa biết tham sế u của nó Để ước
lượng u từ tổng thé ta lập mẫu ngẫu nhiên kích thước n:
W = &, Xe, Xu)
Để chọn thống kê G thích hợp ta xét hai trường hợp sau:
Trang 4
biết thống kê U phân phối chuẩn hóa N (0,1) Do đó với độ tin
cậy (1 — a) cho trước tìm được cap gia tri a, va a, sao cho
a, + Oo, =a ti dé tim duce hai giá trị tới hạn tương ứng của
phân phối chuẩn hóa là u;„„ và u„ thỏa mãn các điểu kiện
PU <u.) = oy
va PU >u,,) =a,
Tu dé Ptu_,, <U<u,,)=1-(a, +a,)=1-0
Vì uạ có tính chất u„ = — u¡ „ nên biểu thức trên có thể
tH
viết
P(Cu„ <U<u,)=1-œ (7.12)
Thay biểu thức của U từ (7.10) vào (7.11) và gidi ra p, ta
thu được biểu thức tương đương:
=— o
PK Fou, <u <K+7eu,,)=1-4 (7.12)
_ Ý nghĩa của biểu thức thu được là: Với độ tin cậy bằng
(1 - a) tham sé p của -biến ngẫu nhiên gốc X sẽ nằm trong khoảng
Œ- EU X + EM.) (7.13)
Biểu thức (7.13) mới chỉ cho ta một khoảng tin cậy tổng
quát Với độ tìn cậy (1 - a) cho trước biển nhiên có thể tìm
được vô số cặp gia tri a, va ay thea man diéu kién a, + ay =a,
từ đó sẽ có vô số ố khoảng tin cậy tương ứng Trong thực tế từ
biểu thức (7.13) người ta thường c chỉ sử dụng một số ð trường
Trang 5
- Khoảng tin cậy đối xứng:
Nếu lấy œ = d; = œ/2 từ (7.13) suy ra khoảng tin cậy của
pla
Œ-[w»4+£ su.) (7.14)
Néu ky hiéu s = + Bay
thì biểu thức của khoảng tìn cậy sẽ có đạng (X~e; X + s)
s được gọi là độ chính xác cha ude lượng Nó phản ánh mức độ sai lệch của trung bình mẫu so với trung bình tổng thể với xác suất (1~ œ) cho trước
- Khoảng tin cậy bên phải:
(7.15)
Néu lay a, = 0 va a, =a thi Uy, =Up = +0 do đó khoảng tin cay cha pla
(X-—u,; +00) vn (7.16)
Biểu thức (7.16) được dùng để ước lượng giá trị tối thiểu
của p
- Khoảng tin cậy bên trái:
Néu ldy a= 0 va a= œ thì Uy, =U, = +0 do dé khodng tin cay cha pla
Trang 6
Với cùng độ tin cậy (1- a) hién nhién khoang tin cay nao
ngắn hơn sẽ tốt hơn Trong trường hợp này độ dai khoang tin
cậy I sẽ là ngắn nhất khi khoảng tin cậy là đối xứng Lúc đó độ dài khoảng tin cay sẽ bằng hai lần độ chính xác và được
xác định bằng biểu thức
J=2e= Va Ugra 2ø (7.18)
Từ (7.18) ta sẽ thu được công thức xác định kích thước
mẫu tối thiểu n sao cho với độ tin cy bang (1 — a) cho trước, độ đài khoảng tin cậy không vượt quá giá trị l„ cho trước Công thức có dạng 402 2 a3 | 12 ¬ [Set (7.19) 9 0 tức là n là số nguyên đương nhỏ nhất lớn hơn hoặc bằng alee
Bài toán xác định kích thước mẫu tối thiểu n theo công
thức (7.19) thường được đặt ra trước khi chọn mẫu, khi phải xác định kích thước mẫu cần điểu tra để đáp ứng những yêu câu chất lượng cho trước về độ tin cậy và độ chính xác của
ước lượng
` Các khoảng tìn cậy (7 14) Œ 16) và (7.17) vẫn đang còn là
khoảng tin cậy ngẫu nhiên Vì vậy thủ tục ước lượng chưa
thể coi là kết thúc Vì độ tin cay a- a), khá lớn nên áp dụng
nguyên lý xác suất lớn có thể coi biến cố _
a ơ : yy, F
Trang 7
sé xảy ra trong một phếp thử đổi với mẫu ngẫu nhiên
W =ŒX, X,, X,) Thue hiện một phép thử đối với mẫu này thu được mẫu cụ thể w = (x,, x, ., %⁄,); từ đó tìm được giá trị
cụ thể x của trung bình mẫu Lúc đó với độ tin cậy (1 - a),
qua một mẫu cụ thể, khoảng tin cậy của pla:
(382) =(k-—-h uj x+-Lu,) 1°62 fn Oy? vn ai
Bằng cách tiến bành tương tự ta cũng thu được khoảng
tin cay cu thể của các công thức (7.14) (7.16) (7.17) cũng như
độ dài cụ thể của khoảng tin cậy theo công thức (7.18)
Đến đây ta thấy rõ vai trò của từng loại mẫu Mẫu ngẫu nhiên cho phép xác định khoảng tin cậy ngẫu nhiên, còn mẫu
cụ thể cho phép tìm ra khoảng tin cậy cụ thể (bằng số) của " Thí dụ 1 Trọng lượng một loại sản phẩm là biến ngẫu
nhiên phân phối theo quy luật chuẩn với độ lệch chuẩn là 1
gam Cân thử 2ö sản phẩm loại này ta thu được kết quả sau Trọng lượng (gam)
Số SP tương ứng
Với độ tin cậy 0,95 hãy tìm khoảng tin cậy đối xứng của trọng lượng trung bình của loại sản phẩm nói trên
Giải Gọi X là “trọng lượng sản phẩm”, theo giả thiết X
phân phối chuẩn với ơ = 1 Vậy trọng lượng trung bình của
san phẩm chính là tham số Đây là bài toán ước lượng bằng
khoảng tin cậy đối xứng giá trị của tham số h của phân phối Nột, ø?) khi đã biết phương sai của nó Vậy theo biểu thức
Trang 8
x Cc
zs OS
_NR x + ye Bera)
Lấy từ tổng thể ra một mẫu ngẫu nhiên kích thước n = 2õ,
gọi X, là trọng lượng của sản phẩm thứ í ( =1,2B) ta có:
W=Œ, Xu X2)
Tw đó: X= ĐÀ X;
Với độ tìn cậy 1 - ơ = 0,95 thì œ/2 = 0,095
Tra bang giá trị tới bạn chuẩn có uọ oạg = 1,96
Vậy khoảng tin cậy đối xứng của ụ là:
(-—_196; X +—— 1,96) = Ø - 0,399, X + 0,392) 425 ` ` 425
Kết quả thu được cho biết 95% số mẫu kích thước n = 25
sẽ chứa đựng tham số k trong khoảng (X- 0,392; X+0 ,392) Từ bằng số liệu tìm được trung bình mẫu cụ thể:
_ 3.18+ð.19+15.20+ 2.21
25
Vậy với độ tin cậy 0,95 qua mẫu cụ thể này, khoảng tin
cậy đối xứng của ki là: (19,64 - 0,392; 19,64 + 0,392) =19,64 | hay (19,248 < p < 20,032) Chú ý rằng không thể viết P(19,248 < u < 20,032) = 0,95
vì độ tin cậy gắn với khoảng tin cậy ngẫu nhiên chữ không gắn với mẫu cụ thể Hơn nữa do k là một hằng số nên nó chỉ
Trang 9
tức là với một mẫu cụ thể thì biến cố (19,248 < pu < 20,032)
không phải là biến cố ngẫu nhiên Hoặc nó là biến cế chắc
chắn, hoặc nó là biến cố ố không thể có:
Chú ý: Từ biểu thức (7.18) ta có thể đưa ra các nhận xét
sau:
- Khi tăng kích thước mẫu n lên và giữ nguyên độ tin cậy
1 ~ œ cho trước thì s giảm đi tức là độ chính xác của ước lượng
tăng lên
- Khi tăng độ tin cậy 1 - œ lên mà giữ nguyên kích thước
mẫu n thì giá trị tới hạn chuẩn cũng tăng lên theo do đó e
cũng tăng lên làm cho độ chính xác của ước lượng giảm đi
Thí dụ 2: Trong thí đụ 1, nếu yêu cầu độ chính xác của
ước lượng chi 14 0,1 và giữ nguyên độ tin cậy 1 ~ œ= 0,95 thì
phải điểu tra một mẫu kích thước bằng bao nhiêu?
Giải: Vối sọ = O,1 theo công thức (7.19) ta có:
2
n>|— 5 (1,96)? |= 385
(0,1)
Vay dé lam tang độ chính xác của ước lượng từ 0,392 lên
đến 0,1 thì kích thước mẫu phải tăng từ 25 lên đến 385
Nếu mẫu được chon theo phương thức không hoàn lại từ tổng thể hữu hạn và n > 0,1N thì Se(X) sé nhan thém hé sé
Trang 10
và việc xây dựng các công thức ước lượng cũng tiến hành
tưởng tự
2 Chưa biết phương sai ở° của biến ngẫu nhiên gốc
X trong tổng thé va kich thước mẫu n < 30
Luc đó ta chọn thống kê:
G=T= đ-ua (7.20)
trong đó S là độ lệch chuẩn mẫu Từ mục §6 Chương VI ta đã
biết thống kê T phân phối theo quy luật Student với (n - 1)
bậc tự do Vì vậy, với độ tin cậy bằng (1 ~ ơ) cho trước có thể
tìm được c&p gid tri a, va a, sao cho a, + a, = a, tit dé tim
được bai giá trị tới han Student tudng ứng là te va ten)
thỏa mãn diéu kién:
RT < te) =a, va
P(T> te) = Oy
Ty dé Per <T<te?) =1-(a, +a,)=1-a
Vì giá trị tới han Student cé tinh chất tP"” = -t") nên
biểu thức có thể viết:
(n-) fa-Dy ’
P(t? <T<t )=i-œ (7.21)
Thay biểu thức của T' từ (7.30) vào (7.21) va gidi ra p ta
Trang 11
xy 5 jon = ne
Kets Xt ty ») S (7.23)
Từ biểu thức tổng quát (7.23) có thể xây dựng công thức
khoảng tin cậy trong những trường hợp đặc biệt sau: - Khoảng tin cậy đối xứng khi Q = ay = o/2 (x 5: ga, X¿-Š có vn (7.34) œ3 + vn a2 ) - Khoảng tin cậy bên phải khi a, = 0; Gy =a (X- ` (7.25) n - Khoang tin cậy bên trái, khi ay = 05a, =a & 5 (co; X + t@Y) (7.26) vn
Trong trường hợp này dé dai khoảng tin cậy ] cũng là
ngắn nhất khi khoảng tim cậy là đối xứng, đo đó nó cũng bằng hai lần độ chính xáe và được xác định bằng biểu thức:
= 38 pon
T=2= Va Gia (7.27)
luúc đó việc xác định kích thước mẫu tối thiểu n sao cho
với độ tin cậy bằng (1 ~ a) cho trước, độ đài khoảng tìm cậy
không vượt quá giá trị I, cho trước được giải quyết bằng phương pháp mẫu kép sau đây:
Trước hết điểu tra một mẫu sơ bộ kích thước m >9:
W,=ŒX, X„) và từ đó tìm được phương sai mẫu của mẫu
Trang 12với X= Sau đó lập mẫu thứ hai kích thước n - m W; = áo a9 X2 Có thể chứng minh được rằng thống kê: ` Die 5
phân phối theo quy luật Student với (m - 1) bậc tự do Vì
vậy, có thể tìm giá trị tật) sao cho: 1< Ss 1< S - Udy, Stee epee DX, +t? tale n È i Vn 2 h n È Vn 12 đo đó Ip = 2S t0 n Từ đây suy ra kích thước mẫu cần tìm: SẼ sự n> Š 2m >| (7.28) sọ
Như vậy, đựa vào mẫu sơ bộ đã có ta tìm được kích thước
mẫu chính thức đáp ứng yêu cầu về chất lượng của tốc lượng Trên thực tế chỉ cần điểu tra tiếp mẫu thứ hai kích
thước n — m là đủ
Trang 13
được các giá trị và s, thay chúng vào các công thức khoảng
tin cậy vừa tìm được ở trên ta có các khoảng tin cậy cụ thể
bằng số phải tìm
Thí dụ 3 Đề xác định trọng lượng trung bình của các bao bột trong kho, người ta đem cân ngẫu nhiên 15 bao của kho
đó và tìm được X = 39,8 kg; s? = 0,144 Hãy tìm khoảng tin
cậy đối xứng của trọng lượng trung bình của các bao bột
trong kho với yêu cầu độ tin cậy của việc ước lượng là 99%
Giả thiết trọng lượng đóng bao của các bao bột là biến ngẫu nhiên phân phối chuẩn
Giải Gọi X là trọng lượng bột đóng bao, theo giả thiết X
phân phối chuẩn Vậy trọng lượng đóng bao trung bình chính là giá trị u Day là bài toán ước lượng bằng khoảng tin cậy
đối xứng giá trị của tham số ¡ của phân phối Nặu, ø?) khi
chưa biết ø? của X Vậy theo biểu thức (7.27) ta có khoảng tin
cậy là:
= Sian, 8
(X— = t |X + Sty) vn œ/3 Jn ald
Cân ngẫu nhiên 1ỗ bao bột, gọi X; @ = 115) là trọng
lượng của bao thứ i ta có mẫu ngẫu nhiên W = &, ., Xia)
Với độ tin cậy 1 ~ ơ = 0,99 thì œ/3 = 0,005 tra bang phan
phối Student có tỊs).= 2,977 Vay với độ tin cậy 0,99 khoảng
tin cậy đối xứng của g là
&-2.2977.% +S 2077 v15 15
Với mẫu cụ thể ta tinh duge x = 39,8, s’= 0,144 > 5= 0,379,
Trang 14
đối xứng của p 1a:
(soa _ 0379 2.977, 398 + 28 2977 X15 W
hay (89,5023 < p < 40,0977)
Thí dụ 4 Phông vấn 5 gia dinh có 3 người về chỉ phí hàng tháng cho nhu yếu phẩm thu được các số liệu sau: 150
ngàn đồng, 180 ngàn, 200 ngàn, 250 ngàn, 300 ngàn Vậy phải phỏng vấn bao nhiêu gia đình cùng loại để với độ tin cậy 95% sai số của việc ước lượng chi phí trung bình hàng tháng
cho nhu yếu phẩm không vượt quá 30 ngàn đồng Giả thiết, chỉ phí hàng tháng cho nhu yếu phẩm là biến ngẫu nhiên
phân phối chuẩn
Giải Gọi X là chỉ phí hàng tháng cho nhu yếu phẩm,
theo giả thiết X phân phối chuẩn Vậy chỉ phí trung bình
chính là giá trị u Đây là bài toán xác định kích thước mẫu
tối thiểu cho việc ước lượng tham số ụ của phân phối Nút, ø?)
khi chưa biết phương sai ơ”
Trang 15
Như vậy phải phỏng vấn thêm 31 — 5 = 26 gia đình nữa
Chú ý rằng khi kích thước mẫu n > 30 thì phân phối Student đã xấp xỉ phân phối chuẩn hóa do đó khi sử dụng các
công thức (7.22 ~ 7.28) có thể dùng các giá trị phân phối
chuẩn hóa để thay thế cho các giá trị của phân phối Student
tương ứng
Thi du 5 Đề xác định kích thước trung bình của chỉ tiết
do một máy sản xuất người ta lấy ngẫu nhiên 200 chỉ tiết để
đo kích thước và thu được bảng số liệu sau (bảng 7.1) Với độ
tin cay 95% hãy ước lượng bằng khoảng tin cậy đối xứng kích
thước trung bình của chỉ tiết đo máy đó sản xuất Giả thiết
Trang 16
Giải Gọi X là kích thước chỉ tiết do máy đó sản xuất Theo giả thiết X phân phối chuẩn Vậy kích thước trung bình
của chỉ tiết chính lä tham số ¿ Đây là bài toán ước lượng
Trang 17
s= đc 0,0002559 = 0,0164 199
Vậy với độ tìn cậy 0,95 qua mẫu cụ thể này khoảng tin
cậy đối xứng của ụ là:
(54,83525 - 29264 5 96.54.99505 4201641 96) - v200 200
hay (54,83298 < p < 54,83752)
Thí dụ Với các số liệu trong thi du A và bằng phần mềm
Stata chúng ta ước lượng với độ tin cậy 0,95 thu nhập trung bình hàng năm của dân cư ba vùng và thu được kết quả sau .centile x1 x2 x3.normal - Normal, based on observed centiles - 1643 1631.245 1654755 ị 50 16575 1645848 1689.182 x3 j 100 50 1624 1612068 1635.932
Nếu mẫu được chọn từ tổng thể hữu hạn theo phương
thức khơng hồn lại và n > 0,1N thì biểu thức (7.20) cha
thống kê G trở thành:
G=T=
[N-n s?
N-1n
và việc xây dựng các công thức ước lượng cũng được tiến
Trang 18
2.3 Ước lượng hiệu hai kỳ vọng toán của hai biến
ngẫu nhiên phân phối chuẩn
Giả sử có hai tổng thể nghiên cứu, trong đó các biến ngẫu nhiên X, và X; cùng phân phối chuẩn với các tham số
đặc trưng tương ứng là lạ, Mạ và ơ?, ơ?, với tị và dạ chưa
biết Để ước lượng sự chênh lệch Bị — Hạ giữa hai kỳ vọng toán
từ hai tổng thể lập hai mẫu ngẫu nhiên độc lập kích thước
tương ứng là n; và n;ạ
W, = Ki, Xv, Xia, )
W;= ạy, Xoo, eee Xen, )
từ đó tìm được các thống kê đặc trưng mẫu tưởng ứng là
Xi, Xe vaS?,S?
Để chọn thống kê G thich hop ta xét các trường hợp sau:
1 Nếu đã biết các phương sơi ơ} và ơ) của các tổng thể
Lúc đó chọn thống kê
Gane tr Xe) Gh - be)
sỉ si nm, fy
Từ mục 6 chương VI ta đã biết U phân phối chuẩn hóa
N(O,1) Do đó với độ tia cậy 1 — œ cho trước tìm được cặp giá
tri a, va a, (a, + a, = a) va hai giá trị tới hạn chuẩn tương
fing 14 u,.,, va u„ thỏa mãn:
PU <u, 4.) =o,
Trang 19
Từ đó:
P12, <U<u,)=l-a s2
Bằng các phép biến đổi như đã làm ở các mục trước ta
thu được khoảng tin cậy mức (1 - a) cua p, — tạ như sau: — 2 22 Pi (X1 ~X2)- Sty uy, < Hy He n, nạ — ot ot < (Ki -Xe)+J-t+—u,, [=1-a (7.29) Mn, nạ
Từ công thức tổng quát (7.29) có thể xây dựng được các
công thức cụ thể như đã làm ở các mục trước:
Trang 20
9 Nếu chưa biết các phương sai ơ? uà co} của các tổng thể, song giả thiết rằng cơ} = ơ? Lúc đó chọn thống kê G=T= (Ki = X2)~ Gy = he) (7.33) 1 1 S;\|—+—— nm, Hạ 4 (n, - trong dé S,=
Ta đã biết thống kê T phan phéi Tin, +n, — 2) do đó tiến hành tương tự như ở các mục trước ta thu được khoảng tin
cậy (1 — œ) của hiệu Hị — Hạ như sau:
<(Œi-Xz)+8, Zo Ragen | 1~ơ (7.34)
1 Hạ
Từ công thức (7.34) có thể xây dựng các khoảng tin cậy đối xứng, khoảng tin cậy bên phải và bên trái như đã làm ở
mục trước
3 Nếu chưa biết các phương sai ơ}? và ơ) của các tổng
thể uà không có căn cứ để cho rằng chúng bằng nhau
Lúc đó chọn lập thống kê
G=T (K1 - X2)- (ey - pe) (7.35)
Trang 21Ta đã biết thống kê T phân phối Student với số bậc tự do là: ke VO, =) (n, “yer +(1- Cn, -1) Sĩ với ==“.— st + S non, do đó khoảng tin cậy mức (1 ~ ơ) của hiệu p, ~ lạ như sau: S? 82 He - Xa)- la” ny = < fy - Hy < 2 2
<(& ~X2)+ (St Sie =i1-a nị nạ “ (7.36) Từ đó có thể xây đựng các khoảng tin cậy đối xứng, bên
phải, bên trái tương ứng
Việc xác định kích thước mẫu để ước lượng hiệu p,- bạ của hai kỳ vọng toán được tiến hành như sau: Giả sử ta chủ
trương lấy ra hai mẫu độc lập có kích thước như nhau và
bằng n và giả sử các phương sai tổng thể đã biết và
bang oj va o3 Lic dé t¥ (7.30) suy ra kích thước n của hai mẫu đảm bảo với độ tin cậy 1 - œ cho trước độ đài của
khoảng tin cậy không vượt quá giá trị Tụ cho trước là:
Trang 22
néu chua biét _o? va o3 thi thay bing wéc lượng của chúng là
Sỹ và S‡ với S? và S7 là phương sai của hai mẫu so bộ kích
thước mị và m; được rút ra tw hai tổng thể nghiên cứu
Thí dụ 6 Từ một chuồng nuôi lợn người ta lấy ra
ngẫu nhiên bốn con đem cân và thu được trọng lượng
tương ứng của chúng là 64, 66, 89 và 77 kg Từ một
chuồng khác lấy ra ba con đem cân thu được trọng lượng 1a 56, 71 va 53 kg Véi d6 tin cậy 95% hãy ước lượng sự
khác biệt về trọng lượng trung bình của hai chuêng lợn
đó Giá thiết trọng lượng của lợn phân phối chuẩn
Giải Gọi Xị và X; tương ứng là trọng lượng của lợn ở hai
chuồng nói trên, theo giả thiết X; và X; phân phối chuẩn Vậy
trọng lượng trung bình là bị và nạ Đây là bài toán ước lượng
hiệu số #ị — uạ khi chưa biết các phương sai của tổng thể Nếu
có thể cho rằng phương sai của chúng bằng nhau (chẳng hạn
cả hai chuồng cùng nuôi một giống lợn và được chăm sóc như
nhau) thì có thể từ công thức ước lượng (7.34) suy ra khoảng
Trang 23_ 3.18267 +2.93 Ss? =1168 P 4+3-2 va eH 257 14~/1168- 545.287 < py — Hy < 1441168 yet get [-7,21 < py — po < 35,21] 4 Ước lượng hiệu hai kỳ tọng toán khi mẫu gồm các số liệu theo cặp
Ö các phan trước ta luôn giả thiết rằng có thể lấy ra hai
mẫu độc lập từ hai tổng thể nghiên cứu Trong nhiều trường
hợp thực tế phải so sánh hai kỳ vọng toán trong điều kiện hai
mẫu được rút ra từ cùng một tổng thể và nói chung là chúng
phụ thuộc nhau Lúc đó nếu hai mẫu bao gồm các cặp giá trị Œ, Y) Œ¿, Y¿) ÓC, Y,) thì lúc đó với mỗi cặp giá trị của hai mẫu có thể xác định sự sai lệch trên từng cặp
D=X%-Y¥, G=in) (7.39)
Liic đó có thể coi D là biến ngẫu nhiên phân phối chuẩn
với các tham số là họ và ơ? và việc xử lý D cũng giống như đã
làm với một mẫu ngẫu nhiên Từ mẫu bao gồm n sai lệch D,
ta tìm được:
_— 1 n
D==5°p, (7.40)
Trang 24va Se(D)==2 véi S) = 1 (7.41) n n-1 Lic dé thong kê g-r-(0-Hp)n _ Tn ~1) Sp nén khodng tin cy mtic (1 - a) cla pip 1a: p_ Sv yo Vn a2, <hp < D+ Sapo da nạ =
Từ đó có thể xây dựng các khoảng tin cậy đối xứng, bên phải, bên trái tưởng ứng
(7.42)
Lúc đó kích thước mẫu tối thiểu n theo độ tin cay (1-a)
cho trước và độ đài của khoảng tin cậy tối đa là lạ cho trước
được xác định bằng công thức
SẼ và,
n> |= (tm)? (7.43)
0
trong dé S32, 14 phương sai của mẫu sơ bộ kích thước m
Thí dụ 7 Giả sử để theo đõi tốc độ tăng trọng trung bình
của một đàn lớn người ta lấy ngẫu nhiên 4 con và cân trọng lượng của chúng vào cầu tháng và cuối tháng Kết quả thu
Trang 25Thứ | TL đầu | TL cuối tự | tháng X;| tháng X, S7 64 7 57 66 73 89 65 BR oOo h = Với độ tìn cậy 95% hãy ước lượng mức tăng trọng trung bình của đàn lợn trong tháng đó
Giải Gọi X, và X, 1A trọng lượng của lớn vào cuối tháng và đầu tháng Giả sử X, và X; phân phối chuẩn Lúc đó tị và
tạ là trọng lượng trung bình tương ứng và: mức tăng trọng
trung bình được xác định bằng giá trị Bọ - ta — Mạ
Trang 26
2.4 Ước lượng xác suất p của biến ngấu nhiên phân phối theo quy luật không - một
Giả sử trong tổng thể biến ngẫu nhiên gốc X phân phối
theo một quy luật nào đó khác với quy luật chuẩn Trong
trường hợp này, để ước lượng giá trị của kỳ vọng toán m chưa biết ta có thể chọn thống kê e=u.®&-mn o nếu đã biết phương saiơ? của X, hoặc thống kê a<u-f#-ma 2
nếu chưa biết phương sai ơ? của X
Từ mục §6 chương VI ta đã biết nếu kích thước mẫu n đủ lớn, cá hai thống kê trên đều phân phối xấp xỉ chuẩn hóa N(0,1) Do đó vẫn có thể tiến hành thủ tục ước lượng bằng
khoảng tin cậy như đã xét ở phần trên Sau đây ta sẽ xét một
trường hợp cụ thể khá thông dụng trong thực tế là bài toán ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối theo
quy luật không - một: A(p)
Giả sử trong tổng thể kích thước N cóM phần tử mang
dấu hiệu nghiên cứu Nếu lấy ngẫu nhiên ra 1 phần tử và gọi
X là số phần tử mang dấu hiệu nghiên cứu được lấy ra thì X là biến ngẫu nhiên phân phối theo quy luật không - một:
ÄXị 0 1 P|1p p
trong đó p là xác suất để lấy ngẫu nhiên một phần tử thì
Trang 27M °N Ta đã biết trong quy luật không - một thì EQO = p và Vợo =Pd-~P) n
này cũng chính là ước lượng xác suất p, mà p lại là tân suất
của tổng thể, phản ánh cơ cấu của tổng thể theo đấu hiệu
nghiên cứu đó Như vậy đây chính là bài toán ước lượng cơ
cấu của tổng thể Từ mục §6 chương VI ta thấy nếu thỏa mãn điều kiện: L P =p i-p P vn , nhu vay ude lugng ky vong toan cha quy luật n>5va <0,3 thi théng ké Œf-p) (f-pWh G=U=~—_ 2 TH 7.44 Se) pap) (744)
phân phối xấp xỉ N(O,1) Vì vậy, với a6 tin cay (1 ~ a) cho
trước có thể tìm được hai giá trị tối hạn chuẩn tr «¿ và tạ;
Trang 28
Phép biến đối tương đương đối với biểu thức trong ngoặc
của (7.45) được tiến hành như sau: Thay U từ (7.44) vào ta có
tương đương với
Bình phương hai vế ta thu được nŒ-p)” < p(1-p)uỆ,; Khai triển và chuyển vế ta thu được bất phương trình: n+u2,,)p? -(2nf +u2,,)p+nf? <0 œ/2 œ/3 Giải ra ta được: nf + uậy sgn nt ~f)+ Mn Pi Pz = ` 2 n tU§¿¿ (7.46) Như vậy với độ tìn cậy (1 ~ a) khoảng tin cậy đối xứng của p là: (Pp, < p < p2) (7.47) v6i piva p, dude xác định từ (7.46) Việc áp dụng các công thức (7.46) và (7.47) khá phức tạp
và chỉ cho phép tìm khoảng tin cậy đối xứng của p Do đó nếu
có thể điều tra một mẫu có kích thước n khá lớn (n > 100) thì
ta có thể chọn thống kê
q=u-f-Đwn
Trang 29
Nó cũng phân phối xấp xỉ N(O,1), do đó với độ tin cậy
Œ ~ ø) cho trước có thể tìm được cặp giá trị œ; và ơ; sao cho
œ + dạ = d, từ đó tìm được hai giá trị tới hạn chuẩn tương
ứng là u „ và u„ thỏa mãn điểu kiện:
PU <uy4,) =o
va PU>u,,) =a,
từ đó - P(u., <U<u,) =1-(,+0)=1-«
Thay giá trị của U từ (7.48) vào và sử dụng tính chất
Ug, = =u; „ sau phép biến đổi tưởng đương ta có
ru, <p «5u, )- l-a (7.49) n n Nhu vậy, với độ tin cậy (1 - œ) khoảng tin cậy của p có dạng: f- Vú :ƒ+ viq-Ð ty vn 23 vn: ” (7.50)
Từ biểu thức tổng quát (7.50) có thể xây đựng được các
khoảng tin cậy cụ thể:
Trang 30
- Khoảng tin cậy bên trai khi a, = 0;0,=0
[-= i.) vn (7.58)
- Độ dài khoảng tin cậy ngắn nhất trong trường hợp
khoảng tin cậy đối xứng:
2/q- 9
I=2e=—————u,„; vn 12 ¢ 7.54)
- Kích thước mẫu tối thiểu n đảm bảo độ tin cậy (1 - œ) cho trước và độ dài khoảng tin cậy không vượt quá giá trị Ïạ
cho trước
n> me x, t8 ° (7.55)
trong đó f là tần suất của mẫu sơ bộ kích thước m > 2
Việc chuyển từ các khoảng tin cậy ngẫu nhiên sang các
khoảng tin cậy bằng số qua một mẫu cụ thể cũng được tiến
hành như đã làm ở các phần trên
Thí dụ 8 Kiểm tra ngẫu nhiên 400 sản phẩm do một
máy sản xuất thấy có 20 phế phẩm Với độ tin cậy 0,95 hãy tốc lượng tỷ lệ phế phẩm tối đa của máy đó
Giải Gọi p là tỷ lệ phế phẩm của máy đó Như vậy p là cơ cấu của tập hợp sản phẩm do máy đó sản xuất theo dấu
hiệu "phế phẩm" Đây là bài toán ước lượng tham số p của quy luật phân phối A(p) bằng khoảng tin cậy bên trái Vậy
khoảng tin cậy của p có đạng (7.53):
—œ yfa~f)
Trang 31
Qua mẫu cụ thể ta có f = ¬ 005 Với 1 - œ = 0,95
> Upos = 1,645 Vay với độ tin cậy 0,95 qua mẫu cụ thể nay khoảng tin cậy của p là:
(30,05 + ¥2:05.0.95 5 45) 400
hay p < 0,0679, hay tỷ lệ phế phẩm tối đa của máy đó là
6,79%
Thí dụ 9 Một vùng có 2000 hộ gia đình Để điều tra nhu
cầu tiêu dùng một loại hàng hóa tại vùng đó người ta nghiên cứu ngẫu nhiên 100 gia đình và thấy có 60 gia đình có nhu cầu về loại hàng hóa trên Với độ tin cậy 0,95 hãy ước lượng bằng khoảng tin cậy đối xứng số gia đình trong vùng có nhu
cầu về loại hàng hóa đó
Giải: Gọi M là số gia đình trong vùng có nhu cầu về loại
hàng hóa đó thì tỷ lệ gia đình có nhu cầu này là:
m
P ` 2000
Như vậy bài toán được đưa về việc ước lượng bằng
khoảng tin cậy đối xứng cơ cấu p của tổng thể Theo công
thức (7.51) khoảng tin cậy của p là:
| ¬ vfa-f) f) _fa-f) Đi “I
"va - tgjy; Ê "vn
Qua mẫu cụ thể ta có f = =" = 0,6; Usjy = Up ons = 1,96
Vậy với độ tin cậy 0,95 khoảng tin cậy đối xứng của p
Trang 32
hay (0,504 < p < 0,696)
Do M = pN = p.2000 nên ta có khoảng tin cậy đối xứng của M với độ tin cậy 0,95 qua mẫu cụ thể này là (1008< M < 1892)
Nếu sử dụng các công thức (7.46) và (7.47) thì kết quả là: 0,6.100+ ; (1,96) - 1,96, iE (1,96)? +9,6.0,4.100 py = 100+ (1,96)? 0,6.100+ 5 (1,96)? + 1964 (1,96)? +.0,6.0,4.100 2s =0691 Pa 100+(1,982 =0502 vậy (0,502 < p < 0,691) do d6 (1004 < M < 1382)
2.5 Ước lượng hiệu hai tham số p của hai biến
ngẫu nhiên phân phối không - một
Giá sử có hai tổng thể nghiên cứu, trong đó các biến
ngẫu nhiên X, và X, phan phéi không - một với tham số
tương ứng là p; và pạ Nếu từ hai tổng thể rút ra hai mẫu ngẫu nhiên độc lập kích thước n¡ và nạ và tìm được các tần
suất tương ứng là f, và f, thì có thể chọn lập thống kê
(7.56)
=U-= Œ -£,)- (p; ~P»)
Trang 33n, ny véi S, = [PxQ=Pi) , Paps) „ cs ,hl-f,) ny nạ
Từ mục 6 chương VI ta đã biết nếu ni, > 30 và nạ > 30 thì
biến ngẫu nhiên U sẽ phân phối xấp xỉ NQ,1) Do đó với cách tiến hành giống như ở mục trước ta thu được khoảng tin cậy
mức (1~œ) của hiệu m — p; như sau:
F#,—)~Sau, <p ~p,<Œ -)+8,w,]Ì=1-a— (59
Xuất phát từ công thức (7.57) có thể xây dựng các
khoảng tin cậy đối xứng, khoảng tin cậy bên phải và bên trái
cho hiệu p; ~ p
Công thức tìm kích thước mẫu tối thiểu cần điều tra với
cả 2 mẫu sao cho với độ tin cậy 1 — œ cho trước, độ dài khoảng
tin cậy không vượt quá Tạ = 2e cho trước có dang:
n>lRq=§)+£q-£,)] 2
Sọ Ware (7.58)
với f, va f, 14 tan sudt cua cdc m4u so bé kich thuée m
Thi du 10 Doanh nghiép du dinh dua san phẩm của mình vào hai thị trường khác nhau Bán thử sản phẩm cho
100 khách hàng tiển năng của thị trường thứ nhất thì có 50
người mua Còn với thị trường thứ hai, khi bán thử sản phẩm
cho 50 khách hàng tiểm năng thì có 20 người mua Với độ tin cậy 95% hãy ước lượng mức độ chênh lệch về thị phần mà
doanh nghiệp có thể đạt được tại hai thị trường đó
"Giải Gọi pị và pp tương ứng là thị phần mà doanh
nghiệp có thể đạt được ở hai thị trường Vậy mức độ chênh
Trang 34
lượng khoảng tin cậy đối xứng của pị ~ p„, trong công thức
(7.57) ta lay a, =a, = $ và thu được công thức ước lượng PÍ(f, ~f,)—8d„; <Pị =bạ <Œ, —f,) +§ru¿„;]=1~œ Với hai mẫu cụ thể m=100 n,=50 =0,5 f;= 0,4 ta tìm được g, = [2898 „ 49ể ~ sa, với 1—œ=0,9ỗ — tợ¿ = Uposs = 196 Vậy {(0,5 — 0,4) — 0,0854.1,96 <p) — pạ < (0,6 — 0,4) + 0,08B4.1,96] {0,0674 < pị - pạ < 0,2674]
Vậy với độ tin cậy 95%, thị phần mà doanh nghiệp có thể
đạt được ở thị trường thứ nhất cao hơn ở thị trường thứ hai
từ 6,74% đến 26,74%
2.6 Ước lượng phương sai của biến ngấu nhiên phân phối theo quy luật chuẩn
Giả sử trong tổng thể biến ngẫu nhiên gốc X phân phối theo quy luật chuẩn N(h,ø?) nhưng chưa biết phương sai ơ?
của nó Để ước lượng œ2 từ tổng thể lập mẫu ngẫu nhiên kích
thước n
W= G,, X,, X)
Trang 35
1 Đã biết kỳ uong toán p cha bién ngdu nhién gốc X
trong tổng thể Lúc đó ta chọn thống kê
(7.59)
Từ mục $6 chương VI ta đã biết thống kê XỶ nói trên phân phối theo quy luật "khi bình phương" với n bậc tự do:
x°(n) Do đó với độ tin cậy (1 - œ) cho trước có thể tìm được
cap gia tri a, vA a, sao cho a, + a, = a tt dé tim được hai giá
trị tới hạn "khi bình phương" tương ứng là xe va rad théa
mãn điều kiện:
PQ? < x70) =a, va
PQ? > x”) =a, do dé
PYRE? <x? <2) 21 - (a,+a,)=1l-a T-ơi G2 (7.60)
Thay gia trị của x? từ (7.59) vào (7.60) và giải ra theo ơ?,
ta thu được biểu thức tương đương: nS *2 2 ns *2 x 3m) <Ø < xâm ey (7.61) Như vậy, với độ tin cậy (1 ~ a) khoang tin cậy của ơ? có dạng: ng *? nS* ——<0?< (7.62) 3m ay
Từ khoảng tin cậy tổng quát (7.62) có thể xây dựng được
Trang 36- Nếu ơi = ơ = g/2, khoảng tin cậy có dạng: n$*? nS+% Ma? 3G (7.63) xy Xinh
Ta chú ý rằng khoảng tin cậy này không đối xứng
- Nếu œ = Ö; dạ = œ, ta có khoảng tin cậy bên phải của ơ?: +2 (Se 5 +a) (7.64) Xa - Néu a, = 0; a, =a, ta c6 khoang tin cAy bén trai cla o”: +3 set) \ Xt-« nó
Với một mẫu cụ thể w = xị, xạ, x„ có thể xác định được
một khoảng tin cậy cụ thể bằng số của ơ” giếng như đã làm ở
các phần trên
Thí dụ 11 Mức hao phí nguyên liệu cho một đơn vị sản
phẩm là biến ngẫu nhiên phân phối chuẩn với trung bình
là 20 gam Để ước lượng mức độ phân tán của mức hao phí
Trang 37
phẩm, X phân phối chuẩn với kỳ vọng toán đã biết u = 20
Đây là bài toán ước lượng phương sai của phân phối N(u,0”)
khi d& biét p Vay theo công thức (7.63) khoảng tin cậy của ola: nS *2 2 nS *2 3a) SG <¬“N Xai2 Xi-ar2 Tra bang gia tri x? ta có: WEP = 188 = 97065 Kita = oes = 14,61 Để tìm s*? ta lập bảng 0,25 0,00
Vậy với độ tin cậy 0,90, qua mẫu cụ thể này, khoảng tin
cậy của ơ” là: ,
25.0,07 25.007
3765 ` 1461 } hay (0,0464 < ø? < 0,1198)
Dé tim khoang tin cậy của ơ ta chỉ cần lấy căn bậc hai
Trang 388 Chưa biết kỳ uọng toán ¡ của biến ngẫu nhiên gốc X trong tổng thể Lúc đó ta chọn thống kê G=z=—— (7.66)
Từ mục §6 chương VI ta đã biết thống kê x? nói trên phân phối theo quy luật "khi bình phương" với (n — 1) bac tu do Vì
vậy, với độ tin cậy (1 — œ) cho trước, có thể tìm được cắp giá trị a, va a, sao cho a, + a, =a, t¥ dé tim duge hai giá trị tới hạn
"khi bình phương" tương ứng là Xi và xen thỏa mãn điều kiện: PŒ< TC =ơi và PQ? > x2?) =a, do đó POG? <x? <2") =1-(@,+0a,)=1-a on (7.67) Thay gia tri cua x’ tix (7.66) vao (7.67) và giải ra ơ? ta có: (n-NS? ; (n-1S?|_ 3mm SE <“n [ii e Kes Xia, Vay với độ tin cậy (1 - œ), khoảng tìn cậy của ơ° là: -1)S?_ (n- 1s? } (a Ss : SE | — (7.88) Xe; Lộ “Oy
Từ công thức (7.68) ta cũng xây dựng được các khoảng
tin cậy trong những trường hợp cụ thể sau:
nw a » : a 213
- Nếu ơi = ơ, = —, khoảng tin cậy của ơ” là:
Trang 39(7.69) - +) } ?{n-1) ((a-DS (@- =| Xã X:-.ư2 - Néu a, = 0; a, = a, ta c6 khoảng tin cậy bên phải cha 0”: (n-1)S? | eae + (7.70) Xu : - Néu a, = 0; a, = a, ta có khoảng tìn cậy bên trái của o?: _ (n-1)S? ° ie (7.71) X1-«
Việc xác định các khoảng tín cậy bằng số qua một mẫu cụ thể cũng tiến hành giống như đã làm ở các phần trên
Thí dụ 12 Với độ tìn cậy 0,95 hãy tước lượng phương sal của kích thước các chỉ tiết trên cd số các số liệu mẫu cho
trong bảng (7.1), biết a, =a, = œ/2 = 0,095
Giải Đây là bài toán ước lượng phương sai của phân
Trang 40
Vậy với độ tin cậy 0,95 qua mẫu dụ thể này, khoảng tin cậy của ơ? là:
199.0,0002689_ 1990,0002689
2848 , 198,98
hay (0,000188 < ø? < 0,000269)
Tương tự như ở mục trước, để tìm khoảng tin cậy của ơ ta chỉ cần lấy căn bậc hai của các công thức ước lượng tương
ứng
2.7 Ước lượng tỷ số của hai phương sai của hai
biến ngẫu nhiên phân phối chuẩn
Giá sử có hai tổng thể nghiên cứu trong đó các biến X, và X, cing phân phối chuẩn với các phương sai a? va a} chua biết Từ các tổng thể trên lập hai mẫu ngẫu nhiên độc lập
kích thước nị và nạ, từ đó tìm được các phương sai mẫu S? và
S và tạo lập thống kê
2 G2
G=F= ao (S? > S2) (7.72)
2 Fj
TY mue §6 chudng VI ta di biét thong ké F phân phối
F(n, - Ln, - 1) Do đó với độ tin cậy 1 — œ cho trước tìm được
cặp giá tri a, va dy (a, + a, = a) từ đó tìm được hai giá trị tới
hạn fm Mar) ya ffbned thỏa mãn điều kiện
PF < £1) <0,
POP> fom),