KHÁI NIỆM Khoảng tin cậy là một dãy giá trị mà trong đó các tham số của tổng thể như số trung bình , tỉ lệ p và phương sai 2 cần được ước lượng nằm trong khoảng này.. ƯỚC LƯỢNG KHOẢNG
Trang 1CHƯƠNG 2:
ƯỚC LƯỢNG KHOẢNG TIN CẬY (Confidence Interval Estimation)
I KHÁI NIỆM
THỂ (KHI BIẾT PHƯƠNG SAI)
III ƯỚC LƯỢNG KHOẢNG TIN CẬY CỦA TRUNG BÌNH TỔNG
THỂ (KHI CHƯA BIẾT PHƯƠNG SAI TỔNG THỂ)
IV ƯỚC LƯỢNG KHOÀNG TIN CẬY CHO TỶ LỆ P TỔNG THỂ:
TRƯỜNG HỢP MẪU LỚN
V ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO SỰ KHÁC BIỆT GIỮA TRUNG BÌNH CỦA HAI TỔNG THỂ
1 Ước lượng khoảng tin cậy dựa trên sự phối hợp từng cặp
2 Ước lượng khoảng tin cậy dựa vào mẫu độc lập của phương sai khác nhau
3 Ước lượng khoảng tin cậy dựa vào mẫu độc lập có phương sai bằng nhau
VI ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO SỰ KHÁC BIỆT GIỮA
HAI TỶ LỆ TỔNG THỂ
VII ƯỚC LƯỢNG CỞ MẪU
1 Cở mẫu cho những khoảng tin cậy của trung bình tổng thể có phân phối chuẩn khi biết phương sai
2 Cở mẫu cho những khoảng tin cậy của tỉ lệ tổng thể
BÀI TẬP
I KHÁI NIỆM
Khoảng tin cậy là một dãy giá trị mà trong đó các tham số của tổng thể như
số trung bình ((), tỉ lệ (p) và phương sai ((2) cần được ước lượng nằm trong
khoảng này Ứơc lượng khoảng tin cậy là một hình thức dự báo trong thống kê, một chỉ tiêu kinh tế nào đó có thể được ước lượng tại một điểm nào đó (dự báo điểm) hay nằm trong một khoảng nào đó (dự báo khoảng) với độ tin cậy cho
trước
Trang 2Ví dụ: Với độ tin cậy 90%, một mẫu gồm 16 quan sát có trung bình từ một
tổng thể có phân phối chuẩn với độ lệch chuẩn = 6 thì trung bình tổng thể ( có
giá trị trong khoảng từ 17,4675 đến 22,5325
Khoảng tin cậy cho trung bình tổng thể được ước lượng dựa vào giá trị
được quan sát của trung bình mẫu Ðặt ( là một tham số chưa biết của tổng thể
Giả sử rằng chúng ta dựa vào thông tin của mẫu quan sát, tìm những biến ngẫu
nhiên A và B sao cho:
P ( A < < B ) = 1 -
trong đó (1 - () là độ tin cậy (level of confidence)
và 100 (1 - ()% là khoảng tin cậy cho (, khoảng này sẽ chứa các tham số
của tổng thể
II ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO TRUNG BÌNH TỔNG THỂ (khi biết phương sai 2 )
Giả sử rằng chúng ta có một mẫu ngẫu nhiên gồm n quan sát từ một phân
phối chuẩn với trung bình ( và phương sai (2, và trung bình mẫu là Ġ Một
khoảng tin cậy 100 (1- ()% cho trung bình tổng thể ( được xác định như sau:
Trong đóĠ là một số sao cho P ( Z ľ) = P ( Z < ĭ) Ľ
và biến ngẫu nhiên Z có phân phối chuẩn tắc:Ġ
Ví dụ: Một qui trình sản xuất đường tinh chế Trọng lượng của những bao đường
có phân phối chuẩn với độ lệch chuẩn 1,2kg Một mẫu ngẫu nhiên gồm 25 bao
có trọng lượng trung bình mỗi bao 19,8 kg
Tìm khoảng tin cậy 95% cho trọng lượng trung bình tổng thể được sản xuất bởi
qui trình
Bảng tra phân phối chuẩn Z được tóm tắt như sau:
0,005 0,01 0,025 0,05 0,1
Z 2,575 2,33 1,96 1,645 1,28 · Khoảng tin cậy 95% cho trung bình tổng thể là:
Vậy, khoảng tin cậy 95% cho trọng lượng trung bình của tất cả các bao
đường của qui trình sản xuất nằm trong khoảng từ 19,33kg đến 20,27kg Như
ta mong đợi, trung bình mẫuĠlà điểm giữa của khoảng chứa đựng (, thì
khoảng rộng w chứa đựng tham số sẽ là:
Trang 3Chú ý:
1 Nếu (1 - () và ( không thay đổi, n càng lớn dẫn đến khoảng tin cậy càng
hẹp cho trung bình tổng thể (, nghĩa là việc ước lượng ( càng chính xác hơn
2 Nếu (1 - () và n cố định, độ lệch chuẩn ( càng lớn thì khoảng tin cậy càng
rộng cho (, càng không chắc chắn hay không chính xác cho ước lượng (
3 Nếu n và ( cố định, (1 - () càng lớn thì khoảng tin cậy càng rộng, dẫn đến (
sẽ rơi vào khoảng giá trị lớn hơn, ước lượng khó chính xác hơn
Cụ thể:
Trong trường hợp mẫu quan sát lớn, ta có thể sử dụng công thức (6.1) để tính
khoảng tin cậy cho tham số (tổng thể nhưng thay độ lệch chuẩn của tổng thể (
bằng độ lệch chuẩn của mẫu (Sx):
Ví dụ: Một mẫu ngẫu nhiên gồm 1562 sinh viên ghi danh học môn Marketing đã
được hỏi để trả lời trong phạm vi từ 1 (không đồng ý) đến 7 (hoàn toàn đồng ý)
với câu nói: Hầu hết các quảng cáo đều đánh lừa sự thông minh của khách hàng
Ðiểm trả lời có trung bình mẫu là 3,92 và độ lệch chuẩn là 1,57 Tìm một
khoảng tin cậy 99% cho trung bình tổng thể
Xuất phát từ công thức :
Ta có: ĉ= 3,92 ; Sx= 1,57 ; n =1562
(1 - ) = 99%
Þ = 1%
/2 = 0,5% = 0,005
Tra bảng trang 76 ta có: Z0,5% = 2,575
3,82 < < 4,02 Như vậy, khoảng tin cậy 99% cho trung bình sự trả lời của sinh viên nằm trong
khoảng từ 3,82 đến 4,02, nghĩa là sinh viên có xu hướng đồng ý câu nói trên
III ƯỚC LƯỢNG KHOẢNG TIN CẬY CỦA TRUNG BÌNH TỔNG THỂ ( khi chưa biết phương sai tổng thể) (mẫu nhỏ)
Trong trường hợp chưa biết phương sai tổng thể ((2), ta có thể sử dụng
biến ngẫu nhiên t với (n -1) độ tự do của phân phối Student thay cho biến ngẫu
nhiên Z và tính giống như trong trường hợp biết phương sai (2 nhưng thay độ
lệch chuẩn tổng thể bằng độ lệch chuẩn mẫu Các điều kiện khác và giả sử giống
như phần (II)
Ta có:ĉ ĉ
Trang 4và khoảng tin cậy 100 ( 1- () % cho ( được tính như sau:
(2.3)
Trong đóĠ là một số sao cho P Ĩľ) =Ġ
Ví dụ: Một mẫu ngẫu nhiên gồm 6 kiện hàng được chọn ra từ tất cả các kiện hàng được sản xuất bởi nhà máy trong một tuần Trọng lượng của 6 kiện hàng lần lượt như sau (kg):
18,6 18,4 19,2 20,8 19,4 20,5 Tìm khoảng tin cậy 90% cho trọng lượng trung bình tổng thể của tất cả các kiện hàng của nhà máy, giả sử phân phối của tổng thể là phân phối chuẩn
Kiện hàng (i)
Trọng lượng (kg) (xi)
(xi2)
Tổng cộng 116,9 2282,4
1
Từ dữ liệu bảng trên tính được:ĉ Ľ 19,4833Ġ
= 0,96
vàĠ(tn-1,(/2 Ľ: giá trị tra bảng phân phối Student t
Vậy: ĉ
18,67 < < 20,29
Vì vậy, khoảng tin cậy 90% cho trọng lượng trung bình của tất cả các kiện hàng nằm trong khoảng từ 18,67 kg đến 20,29kg
Trang 5Chú ý: Trong điều kiện như nhau, nếu khoảng tin cậy (KTC) càng lớn thì khoảng
ước lượng giá trị càng lớn, càng kém chính xác
IV ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO TỶ LỆ P TỔNG THỂ: trường hợp mẫu lớn
ÐặtĠ là tỉ lệ được quan sát của mẫu ngẫu nhiên gồm n quan sát từ một tổng thể
Khoảng tin cậy 100 (1-() % cho tỉ lệ p của tổng thể được tính bởi:
(2.4) Trong đó Z(/2 là một số sao cho:
· Nếu tất cả các điều kiện khác không thay đổi, n càng lớn thì khoảng chứa đựng p
càng hẹp, ước lượng càng chính xác hơn
· Nếu tất cả các điều kiện khác không thay đổi, khoảng tin cậy càng lớn thì khoảng
biến thiên giữa hai giá trị ước lượng của p càng lớn, ứơc lượng khó chính xác
Ví dụ: Một mẫu ngẫu nhiên gồm 73 lãnh đạo ngân hàng được hỏi câu hỏi sau:
Trong mỗi ngành thường phải chấp nhận những rủi ro trong kinh doanh Vậy,
ngân hàng của bạn có bất kỳ thực tế nào mà bạn xem như không đúng nguyên tắc,
nội qui và đạo lý Kết quả có 39 câu trả lời không Tìm khoảng tin cậy 95% cho tỉ
lệ tổng thể những lãnh đạo ngân hàng trả lời không
Vì vậy, khoảng tin cậy 95% cho phần trăm của tất cả các lãnh đạo ngân hàng nói
chung nhận thấy trong ngành của mình không có những rủi ro trong kinh doanh do
không làm đúng nguyên tắc và đạo lý là khoảng từ 42% đến 64,8%
V ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO SỰ KHÁC BIỆT GIỮA TRUNG BÌNH CỦA HAI TỔNG THỂ
1 Ước lượng khoảng tin cậy dựa trên sự phối hợp từng cặp: (Matched pair)
Giả sử rằng chúng ta có một mẫu ngẫu nhiên gồm n cặp quan sát từ những
phân phối với trung bình (x và (y ÐặtĠ và Sd là trung bình và độ lệch chuẩn
của n sự khác biệt di= xi - yi Nếu phân phối của những khác biệt này là phân
phối chuẩn thì
· Khoảng tin cậy 100 (1 - () % cho ((x - (y) được tính như sau:
Trang 6(2.4)
Trong đóĠlà một số sao cho P Ĩľ) =Ġ
Ví dụ: Trọng lượng của các kiện hàng (kg) được sản xuất bởi hai phân xưởng trong một nhà máy được cho trong bảng dưới đây:
Bảng 2.1:
Kiện hàng Phân xưởng
A
Phân xưởng
B
(i) (xi: kg) (yi: kg) di = xi - yi di
2
1 19,4 19,6 - 0,2 0,04
2 18,8 17,5 1,3 1,69
3 20,6 18,4 2,2 4,84
4 17,6 17,5 0,1 0,01
5 19,2 18,0 1,2 1,44
6 20,9 20,0 0,9 0,81
7 18,3 18,8 - 0,5 0,25
8 20,4 19,2 1,2 1,44
Tổng cộng 6,2 10,52
= 0,775 = 0,816
và Ġ t n-1, (/2 = t 7, 0,5% = 3,499
· Khoảng tin cậy 99% cho ((x - (y):
- 0,342 < x - y < 1,892
Vì vậy, khoảng tin cậy 99% cho sự chênh lệch trọng lượng trung bình tổng thể của mỗi kiện hàng được sản xuất từ hai phân xưởng nằm trong khoảng - 0,342 kg
Trang 7đến 1,892 kg Khoảng này chứa đựng giá trị 0, điều này cho ta đoán rằng có sự
bằng nhau về trọng lượng trung bình mỗi kiện hàng được sản xuất từ hai phân
xưởng
2 Ước lượng khoảng tin cậy dựa vào mẫu độc lập có phương sai khác nhau: (Independent samples)
Giả sử có hai mẫu ngẫu nhiên độc lập có nx và ny quan sát từ những phân
phối chuẩn có trung bình (x và (y và phương sai (x2 và (y2 Nếu trung bình
mẫu làĠ vàĠ thì khoảng tin cậy 100 (1 - () % cho ( (x - (y) được tính:
(2.5)
Trong đóĠ là một số sao cho P ( Z ľ) =Ġ
Ví dụ: Một mẫu ngẫu nhiên gồm 96 người hút thuốc lá, lượng giờ trung bình của
những người nghỉ việc không có lý do là 2,15 giờ trong tháng và độ lệch chuẩn là
2,09 giờ/ tháng Một mẫu ngẫu nhiên độc lập khác gồm 206 người không hút
thuốc lá, lượng giờ trung bình của những người nghỉ việc là 1,69 giờ/tháng, độ
lệch chuẩn của mẫu là 1,91 giờ/ tháng Tìm khoảng tin cậy 99% cho sự khác biệt
của hai trung bình tổng thể
Trong khoảng từ - 0,19 đến 1,11 chứa giá trị 0, có nghĩa là những bằng chứng
trong tài liệu không đủ mạnh để bác bỏ sự phán đoán rằng số người nghỉ việc
trung bình của cả hai nhóm người này là bằng nhau
3 Ước lượng khoảng tin cậy dựa vào mẫu độc lập có phương sai bằng nhau:
Ví dụ: Một nghiên cứu về hiệu quả trong việc hoạch định tài chánh của ngân hàng
Một mẫu ngẫu nhiên gồm 6 nhà hoạch định cho rằng tốc độ tăng thu nhập trung
bình hàng năm là 9,972% và độ lệch chuẩn là 7,470 Một mẫu ngẫu nhiên độc lập
gồm 9 ngân hàng không có hệ thống hoạch định chính thức có tốc độ tăng thu
Trang 8nhập trung bình hàng năm là 2,098% và độ lêch chuẩn là 10,834 Giả sử rằng hai
phân phối tổng thể có cùng phương sai, tìm khoảng tin cậy 90% cho sự khác biệt
giữa hai trung bình
Ta có:
Thay vào công thức trên ta có:
-1,161 < x - y < 16,909 Vậy khoảng tin cậy 90% cho sự khác biệt giữa tốc độ tăng thu nhập trung bình hai
tổng thể bao gồm cả giá trị 0 (nghĩa là tốc độ tăng thu nhập là bằng nhau của hai
tổng thể), nhưng tài liệu mẫu cho thấy khả năng hai trung bình này bằng nhau thì
rất nhỏ
VI ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO SỰ KHÁC BIỆT GIỮA HAI TỈ LỆ TỔNG THỂ (trường hợp n lớn)
ÐặtĠ là tỉ lệ của mẫu có nx quan sát từ một tổng thể với tỉ lệ px;vàĠ là tỉ lệ của
mẫu có ny quan sát từ một tổng thể với tỉ lệ py Ta có khoảng tin cậy 100 ( 1 - (
)% của sự khác biệt giữa px và py:
Trong đó Z(/2 là một số sao cho P ( Z > Z(/2 ) =Ġ
Ví dụ: Một mẫu ngẫu nhiên gồm 98 kế toán viên, trong đó 48 người đồng ý rằng
Mỗi một chương trình kế toán nên có một phần mềm ứng dụng riêng biệt và đó
cũng là đòi hỏi của tất cả kế toán viên Một mẫu ngẫu nhiên độc lập gồm 127 giáo
viên kế toán, 21 người đồng ý với điều này Tìm khoảng tin cậy 95% cho sự khác
biệt giữa hai tỉ lệ của tổng thể những người sẽ đồng ý với luận điểm trên
Kết luận: Sự thật rằng khoảng 20,7% đến 44,3% đồng ý với yêu cầu trên nhưng
những nhà kế toán thích có một phần mềm ứng dụng riêng biệt hơn là các giáo
viên
VII ƯỚC LƯỢNG CỞ MẪU (Estimating the sample size)
Chúng ta đã phát triển những phương pháp để tìm khoảng tin cậy cho một
tham số của tổng thể trên cơ sở thông tin của mẫu Theo một tiến trình như vậy,
một nhà điều tra có thể tin rằng nếu khoảng tin cậy mang lại kết quả quá rộng thì
phản ánh một điều không mong muốn, bởi vì nó không chắc chắn cho tham số
đang được ước lượng Một cách điển hình, chỉ có một hướng để đạt được khoảng
hẹp hơn với độ tin cậy cao hơn là tăng số quan sát hay tăng cỡ mẫu (n lớn hơn)
Trong một số trường hợp, các nhà điều tra có thể cố định trước độ rộng của
khoảng tin cậy, chọn n vừa đủ lớn để đảm bảo độ rộng đó Vậy làm thế nào cỡ
mẫu có thể được chọn theo hướng này cho hai vấn đề ước lượng khoảng
1 Cỡ mẫu cho những khoảng tin cậy của trung bình tổng thể có phân phối chuẩn khi biết phương sai:
Trang 9Xuất phát từ công thức (2.1):Ġ
Giả sử rằng một mẫu ngẫu nhiên gồm n quan sát từ một phân phối chuẩn có trung bình ( và phương sai (2 Một khoảng tin cậy 100 (1 - ()% cho trung bình tổng thể
và một khoảng cách L =Ġ cho mỗi bên của trung bình mẫu thì số quan sát (cỡ mẫu) là :
(2.8) Trong đó: Z(/2 là một số sao cho P ( Z > Z(/2 ) =Ġvà Z có một phân phối chuẩn tắc
Ví dụ : Chiều dài của những que kim loại được sản xuất bởi một qui trình công nghệ cao có phân phối chuẩn với độ lệch chuẩn là 1,8mm Một mẫu ngẫu nhiên gồm 9 quan sát từ tổng thể này, khoảng tin cậy 99% cho ước
lượng trung bình tổng thể là 194,65 < ( < 197,75 thì được tìm ra cho chiều dài trung bình tổng thể Giả sử một quản đốc sản xuất thì tin rằng khoảng cách thì quá rộng cho việc sử dụng thực tế và yêu cầu thay thế một khoảng tin cậy 99% không được mở rộng hơn 0,5mm cho mỗi bên của trung bình mẫu Hãy tìm cỡ mẫu để đạt được khoảng cách như vậy?
Ta có: L = 0,5 ( = 1,8 Z(/2 = Z0,5% = 2,575
Vì vậy, để thỏa mãn yêu cầu của quản đốc phân xưởng chúng ta cần một cỡ mẫu
ít nhất phải là 86 quan sát Tuy nhiên, trong thực tế sự tăng lên trong cỡ mẫu thì yêu cầu chi phí cao hơn để đạt được sự ước lượng cho trung bình tổng thể có khoảng tin cậy hẹp hơn
2 Cỡ mẫu cho những khoảng tin cậy của tỉ lệ tổng thể:
Xuất phát từ công thức:
Giả sử rằng một mẫu ngẫu nhiên gồm n quan sát, một khoảng tin cậy 100 (1- ()% cho tỉ lệ tổng thể p được cho bởi công thức trên và khoảng cách cho mỗi bên của tỉ lệ mẫu là :
Tuy nhiên tỉ lệĠ không thể được lớn hơn 0,25 (giá trị khi tỉ lệ mẫu là 0,5) Vì vậy, giá trị có thể lớn nhất cho L là
Nếu sau đó một nhà điều tra muốn chọn một cỡ mẫu lớn hơn có ý nghĩa cho việc bảo đảm khoảng tin cậy không rộng hơn khoảng cách L* cho mỗi bên của tỉ lệ mẫu
Ví dụ: Trở lại ví dụ về những nhà lãnh đạo ngân hàng trả lời không về việc chấp nhận những thực tế trong kinh doanh dựa trên 73 quan sát và chúng ta đã tính khoảng tin cậy 95% cho tỉ lệ của tổng thể là:
Trang 100,42 < p < 0,648 Giả sử chúng ta muốn chắc chắn một khoảng tin cậy 95% cho tỉ lệ tổng thể không lớn hơn 0,06 cho mỗi bên của tỉ lệ mẫu thì cỡ mẫu của chúng ta sẽ là bao nhiêu?
Vậy để chắc chắn đạt được khoảng tin cậy hẹp hơn, ít nhất chúng ta phải chọn n =
267
BÀI TẬP
1 Một quá trình sản xuất gạch, trọng lượng những viên gạch nầy được giả sử có phân phối chuẩn có độ lệch chuẩn 0,12kg Một mẫu ngẫu nhiên gồm 16 viên gạch vừa sản xuất ra trong ngày có trọng lượng trung bình 4,07kg
a Tìm khoảng tin cậy 99% của trọng lượng trung bình của tất cả các viên gạch trong ngày?
b Không cần tính toán, khoảng tin cậy 95% thì trung bình tổng thể sẽ rộng hơn, hẹp hơn hay bằng với kết quả câu a?
c Không cần tính toán, một mẫu ngẫu nhiên gồm 20 viên gạch sẽ được chọn ra trong ngày mai Khoảng tin cậy 99% thì trọng lượng trung bình tổng thể của tất cả các viên gạch sản xuất ra trong ngày mai sẽ lớn hơn, nhỏ hơn hay bằng như trong câu a?
d Sự thật rằng, độ lệch chuẩn của các viên gạch sản xuất trong ngày mai là 0,15kg, không cần tính toán, khoảng tin cậy 99% thì trọng lượng trung bình tổng thể của tất cả các viên gạch sản xuất ra trong ngày mai sẽ rộng hơn, hẹp hơn hay bằng như trong câu a?
2 Một quản đốc biết rằng lượng tạp chất trong các kiện sản phẩm có phân phối chuẩn với độ lệch chuẩn bằng 3,8 g Một mẫu ngẫu nhiên gồm 9 kiện hàng được kiểm tra và thấy lượng tạp chất như sau (g):
18,2 13,7 15,9 17,4 21,8 16,6 12,3 18,8 16,2
a Tìm khoảng tin cậy 90% cho trọng lượng trung bình của tạp chất trong tổng thể?
b Không cần tính toán, nếu khoảng tin cậy 95% thì trung bình tổng thể sẽ rộng hơn, hẹp hơn hay bằng như trong câu a?