5 KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
5.2 So sánh tỷ lệ tổng thể với một số
Bài 1. Một máy sản xuất tự động, lúc đầu tỷ lệ sản phẩm loại A là 52% . Sau khi áp dụng một phương pháp sản xuất mới người ta kiểm tra 500 sản phẩm thì thấy có 285 sản phẩm loại A. Với mức ý nghĩa α = 5%, hãy kết luận xem phương pháp sản xuất mới có thực sự làm tăng tỷ lệ sản phẩm loại A lên hay không?
BÀI GIẢI
Gọi p là tỷ lệ sản phẩm loại A của máy sau khi áp dụng phương pháp sản xuất mới (p chưa biết). Để kết luận phương pháp sản xuất mới có thực sự làm tăng tỷ lệ sản phẩm loại A lên hay không ta đi kiểm định giả thiết
H0 : p= 52% = 0,52;H1 : p6= 0,52.
Tỷ lệ sản phẩm loại A của mẫu là f = nA
n =
285
500 = 0,57
Với mức ý nghĩa α= 5%, tra bảng 3 ta sẽ tìm được giá trị của tα = 1,96. Tính kiểm định t= (f −p0)·√n p p0(1−p0) = (0,57−0,52)·√500 p 0,52·(1−0,52) = 2,2379
Ta thấy |t| > tα nên bác bỏ giả thiết H0, tức p 6= 0,52. Do f > 0,52 nên ta xem như p >0,52
Vậy phương pháp sản xuất mới thực sự làm tăng tỷ lệ sản phẩm loại A lên. Bài 2. Tỷ lệ phế phẩm của một nhà máy trước đây là 5,5%. Năm nay nhà máy áp dụng một biện pháp kỹ thuật mới. Để nghiên cứu tác dụng của biện
pháp kỹ thuật mới người ta lấy một mẫu gồm 800 sản phẩm để kiểm tra và thấy có 30 phế phẩm trong mẫu này.
a) Với mức ý nghĩa α = 6%, hãy kết luận về tác dụng của biện pháp kỹ thuật mới này?
b) Nếu nhà máy báo cáo tỷ lệ phế phẩm sau khi áp dụng biện pháp kỹ thuật mới đã giảm xuống chỉ còn 3,5% thì có chấp nhận được hay không (với mức ý nghĩa α= 5%)?
BÀI GIẢI
Gọi p là tỷ lệ sản phế phẩm của nhà máy sau khi áp dụng phương pháp sản xuất mới (p chưa biết).
a) Để kết luận tác dụng của biện pháp kỹ thuật mới này ta đi kiểm định giả thiết H0 :p = 5,5% = 0,055;H1 : p6= 0,055.
Tỷ lệ phế phẩm của mẫu là f = nA
n =
30
800 = 0,0375
Với mức ý nghĩa α= 6%, tra bảng 3 ta sẽ tìm được giá trị của tα = 1,8808. Tính kiểm định t= (f −p0)·√n p p0(1−p0) = (0,0375−0,055)·√800 p 0,055·(1−0,055) = −2,1711 Ta thấy |t| > tα nên bác bỏ giả thiết H0, tức là p 6= 0,055. Do f > 0,055 nên ta xem như p > 0,055 Vậy biện pháp kỹ thuật mới này có tác dụng làm giảm tỷ lệ phế phẩm của nhà máy.
b) Để kết luận báo cáo của nhà máy có chấp nhận được hay không, ta đi kiểm định giả thiết H0 : p= 3,5% = 0,035;H1 :p 6= 0,035.
Tỷ lệ phế phẩm của mẫu là f = 0,0375
Với mức ý nghĩa α= 5%, tra bảng 3 ta sẽ tìm được giá trị của tα = 1,96. Tính kiểm định t= (f −p0)·√n p p0(1−p0) = (0,0375−0,035)·√800 p 0,035·(1−0,035) = 0,3848 Ta thấy |t| < tα nên chấp nhận giả thiết H0.
Vậy nhà máy báo cáo tỷ lệ phế phẩm sau khi áp dụng biện pháp kỹ thuật mới đã giảm xuống chỉ còn 3,5% là chấp nhận được.
5.3 Bài tập tổng hợp
Bài 1. Khảo sát về thu nhập X (triệu đồng/tháng) của một số công nhân tại một công ty may mặc người ta có bảng số liệu sau:
Thu nhập 2−3 3−4 4−5 5−6 6−7 7−9
a) Tính trung bình mẫu, độ lệch chuẩn mẫu.
b) Hãy ước lượng thu nhập trung bình của một người trong một tháng với độ tin cậy 95%?
c) Giả sử công ty báo cáo rằng "mức thu nhập trung bình của một người là 5.000.000 đồng/tháng" thì có chấp nhận được hay không (với mức ý nghĩa 5%)?
d) Những người có mức thu nhập không quá 4.000.000 đồng/tháng là những người có mức thu nhập thấp. Hãy ước lượng tỷ lệ những người có mức thu nhập thấp với độ tin cậy 96%?
e) Giả sử công ty báo cáo rằng "Tỷ lệ những người có mức thu nhập thấp của công ty là 10%" thì có chấp nhận được không (với mức ý nghĩa 7%)? BÀI GIẢI
Ta viết lại bảng:
Thu nhập 2,5 3,5 4,5 5,5 6,5 8
Số người 5 9 30 25 10 6
a) Dựa vào bảng số liệu, ta tính được: Cỡ mẫu n= 85 Trung bình mẫu: x = 1 n k X i=1 nixi = 5,0529 Độ lệch chuẩn: s = v u u t 1 n−1 " k X i=1 nix2 i −n(x)2 # = 1,2979
b) Gọi m là mức thu nhập trung bình một người trong một tháng của công ty. Đây là bài toán ước lượng trung bình với n = 85> 30 và σ2 chưa biết.
Với độ tin cậy 1−α= 95%, tra bảng 3 ta sẽ tìm được giá trị của tα = 1,96. Độ chính xác ε= tα· √s
n = 0,2759.
Khoảng ước lượng của m là x−ε < m < x+ε
⇐⇒5,0529−0,2759 < m < 5,0529 + 0,2759 ⇐⇒4,7770 < m < 5,3288 Vậy với độ tin cậy 95%, khoảng ước lượng thu nhập trung bình của công ty này là (4,7770; 5,3288) tấn.
c) Ta kiểm định giả thiết H0 :m = 5;H1 : m6= 5.
Đây là bài toán kiểm định giả thiết về trung bình của tổng thể trong trường hợp n = 85> 30 và σ2 chưa biết. Tính kiểm định t= (x−m0)√ n s = (5,0529−5)√ 85 1,2979 = 0,3758 Với mức ý nghĩa tra bảng 3 ta tìm được giá trị
Ta thấy |t| < tα nên nhận chấp giả thiết H0.
Vậy công ty báo cáo "Mức thu nhập trung bình của một người là 5.000.000 đồng/tháng" là chấp nhận được.
d) Tỷ lệ của người có thu nhập thấp là f = nA
n =
5 + 9
85 = 0,1647.
Với độ tin cậy 1−α= 96%, tra bảng 3 ta sẽ tìm được giá trị của tα = 2,0537. Độ chính xác ε= tα· r f(1−f) n = 2,0537· r 0,1647 (1−0,1647) 85 = 0,0826. Khoảng ước lượng của p là f −ε < p < f +ε
⇐⇒ 0,1647−0,0826 < p <0,1647 + 0,0826 ⇐⇒0,0821 < p < 0,2473 Vậy với độ tin cậy 96%, khoảng ước lượng tỷ lệ người có mức thu nhập thấp của công ty này là (0,0821; 0,2473).
e) Để kết luận báo cáo của công ty có chấp nhận được hay không, ta đi kiểm định giả thiết H0 :p = 10% = 0,1;H1 : p6= 0,1.
Với mức ý nghĩa α= 7%, tra bảng 3 ta sẽ tìm được giá trị của tα = 1,8119. Tính kiểm định t= (f −p0)·√n p p0(1−p0) = (0,1647−0,1)·√85 p 0,1·(1−0,1) = 1,9883 Ta thấy |t| > tα nên bác bỏ giả thiết H0.
Ngoài ra, do f > 0,1 nên ta xem như p >0,1
Vậy công ty báo cáo rằng "Tỷ lệ những người có mức thu nhập thấp của công ty là 10%" thì không chấp nhận được.
Bài 2. Điều tra năng suất của một giống lúa trên 100 ha, ta có bảng số liệu: Năng suất (tấn/ha) 8 8,5 9 9,5 10 11
Số ha 6 14 20 35 20 5
a) Hãy ước lượng năng suất lúa trung bình trên mỗi hécta với độ tin cậy 99%?
b) Những thửa ruộng có năng suất từ 9 tấn/ha trở lên được gọi là đạt tiêu chuẩn. Hãy ước lượng tỷ lệ các thửa ruộng đạt tiêu chuẩn với độ tin cậy 95%?
c) Muốn độ chính xác khi ước lượng năng suất lúa trung bình không quá 0,1 với độ tin cậy 95% thì cần quan sát thêm ít nhất bao nhiêu hecta nữa? d) Theo một tài liệu thống kê cho biết năng suất lúa trung bình của giống
lúa trên là 10 (tấn/ha). Hãy cho biết bảng số liệu trên có phù hợp với tài liệu này không (với mức ý nghĩa 5%)?
BÀI GIẢI
Dựa vào bảng số liệu, ta tính được: Cỡ mẫu n= 100 Trung bình mẫu: x= 1 n k X i=1 nixi= 9,345 Độ lệch chuẩn: s= v u u t 1 n−1 " k X i=1 nix2 i −n(x)2 # = 0,6842 a) Gọi m là năng suất lúa trung bình trên mỗi hécta của vùng.
Đây là bài toán ước lượng trung bình với n = 100> 30 và σ2 chưa biết.
Với độ tin cậy 1−α= 99%, tra bảng 3 ta sẽ tìm được giá trị của tα = 2,5758. Độ chính xác ε =tα · √s
n = 2,5758· 0√,6842
100 = 0,1762. Khoảng ước lượng của m là x−ε < m < x+ε
⇐⇒9,345−0,1762 < m < 9,345 + 0,1762 ⇐⇒9,1688< m <9,5212 Vậy với độ tin cậy 99%, năng suất lúa trung bình là (9,1688; 9,5212) tấn/ha. b) Gọi p là tỷ lệ năng suất lúa đạt tiêu chuẩn của vùng (p chưa biết).
Tỷ lệ của người có thu nhập thấp là f = nA
n =
80
100 = 0,8.
Với độ tin cậy 1−α= 95%, tra bảng 3 ta sẽ tìm được giá trị của tα = 1,96. Độ chính xác ε= tα· r f(1−f) n = 1,96· r 0,8 (1−0,8) 100 = 0,0784. Khoảng ước lượng của p là f −ε < p < f +ε
⇐⇒0,8−0,0784 < p <0,8 + 0,0784⇐⇒ 0,7216 < p <0,8784
Vậy với độ tin cậy 95%, khoảng ước lượng tỷ lệ các thửa ruộng đạt tiêu chuẩn của vùng này là (0,7216; 0,8784).
c) Đây là bài toán xác định kích thước mẫu (tối thiểu) trong trường hợp ước lượng trung bình của tổng thể.
Theo giả thiết ta có ε = 0,2 và 1−α= 0,95⇐⇒tα = 1,96 Kích thước mẫu n tối thiểu sẽ là
n= t2 α σ2 ε2 + 1 = 1,962 · 0,4682 0,12 + 1 ⇐⇒n= [179,86] + 1 = 180 Vậy muốn độ chính xác khi ước lượng năng suất lúa trung bình không quá 0,1 với độ tin cậy 95% thì ta cần quan sát thêm ít nhất 180−100 = 80 hecta nữa. d) Ta kiểm định giả thiết H0 : m= 11;H1 :m 6= 11.
hợp n = 100> 30 và σ2 chưa biết. Tính kiểm định t= (x−m0)√ n s = (9,345−10)√ 100 0,6842 = −9,5732 Với mức ý nghĩa α= 5% tra bảng 3 ta tìm được giá trị tα = 1,96 Ta thấy |t| > tα nên bác bỏ giả thiết H0.
Vậy bảng số liệu trên chưa phù hợp với tài liệu này.
Bài 3. Để nghiên cứu nhu cầu một loại hàng, người ta khảo sát nhu cầu của mặt hàng này ở 500 hộ gia đình. Ta được bảng số liệu sau:
Nhu cầu (kg/tháng) 0−2 2−4 4−6 6−8 8−10
Số gia đình 70 110 180 100 40
a) Hãy ước lượng nhu cầu về mặt hàng này của toàn khu vực trong một tháng với độ tin cậy 95%. Giả sử khu vực đó có 5000 hộ gia đình.
b) Những gia đình có nhu cầu về mặt hàng này lớn hơn6 kg/tháng là những gia đình có nhu cầu cao. Hãy ước lượng tỷ lệ gia đình có nhu cầu cao trong một tháng với độ tin cậy 97%
c) Nếu cho rằng tỷ lệ gia đình có nhu cầu cao trong một tháng là 30% thì có chấp nhận được hay không (với mức ý nghĩa α= 0,03)?
d) Nếu cho rằng nhu cầu trung bình về mặt hàng này của toàn khu vực là27 tấn/tháng thì có chấp nhận được hay không (với mức ý nghĩa α= 0,05)? BÀI GIẢI
Ta viết lại bảng:
Nhu cầu (kg/tháng) 1 3 5 7 9
Số gia đình 70 110 180 100 40
Dựa vào bảng số liệu, ta tính được: Cỡ mẫu n= 500. Trung bình mẫu: x = 1 n k X i=1 nixi = 4,72 Độ lệch chuẩn: s = v u u t 1 n−1 " k X i=1 nix2 i −n(x)2 # = 2,2654
a) Gọi m là nhu cầu trung bình của mặt hàng này trong một tháng ở mỗi hộ gia đình.
Đây là bài toán ước lượng trung bình với n = 500> 30 và σ2 chưa biết: Với độ tin cậy 1−α= 95%, tra bảng 3 ta sẽ tìm được giá trị của tα = 1,96.
Độ chính xác ε =tα · √s
n = 1,96· 2√,2654
500 = 0,1986. Khoảng ước lượng của m là x−ε < m < x+ε
⇐⇒4,72−0,1986 < m < 4,72 + 0,1986⇐⇒ 4,5214 < m <4,9186 Vậy với độ tin cậy95%, khoảng ước lượng nhu cầu về mặt hàng này của toàn khu vực trong một tháng là (4,5214.5000; 4,9186.5000) kg hay (22,6; 24,6) tấn. b) Gọi p là tỷ lệ hộ gia đình có nhu cầu về mặt hàng này cao (lớn hơn 6 kg/tháng và p chưa biết).
Tỷ lệ mẫu là f = nA
n =
100 + 40
500 = 0,28.
Với độ tin cậy 1−α= 97%, tra bảng 3 ta sẽ tìm được giá trị của tα = 2,1701. Độ chính xác ε =tα · r f(1−f) n = 2,1701· r 0,28 (1−0,28) 500 = 0,0436. Khoảng ước lượng của p là f −ε < p < f +ε
⇐⇒0,28−0,0436 < p <0,28 + 0,0436⇐⇒ 0,2364 < p <0,3236 Vậy với độ tin cậy 97%, khoảng ước lượng tỷ lệ hộ gia đình có nhu cầu về mặt hàng này cao là (0,2364; 0,3236).
c) Ta đi kiểm định giả thiết H0 : p = 30% = 0,3;H1 : p6= 0,3.
Với mức ý nghĩa α= 0,03, tra bảng 3 ta sẽ tìm được giá trị của tα = 2,1701. Tính kiểm định t= (f −p0)·√n p p0(1−p0) = (0,28−0,3)·√500 p 0,3·(1−0,3) =−0,9759 Ta thấy |t| < tα nên chấp nhận giả thiết H0.
Vậy với mức ý nghĩa α = 0,03 thì tỷ lệ gia đình có nhu cầu về mặt hàng này cao trong một tháng là 30% thì có chấp nhận được.
d) Ta kiểm định giả thiết H0 : m= 27000
5000 = 5,4;H1 : m 6= 5,4.
Đây là bài toán kiểm định giả thiết về trung bình của tổng thể với n= 500 >30 và σ2 chưa biết. Tính kiểm định t= (x−m0)√ n s = (4,72−5,4)√ 500 2,2654 =−6,712
Với mức ý nghĩa α= 5% tra bảng 3 ta tìm được giá trị tα = tα = 1,96 Ta thấy |t| > tα nên bác bỏ giả thiết H0.
Vậy với mức ý nghĩa α = 0,05 thì nhu cầu trung bình về mặt hàng này của toàn khu vực là 27 tấn/tháng là không chấp nhận được.
Bài 4. Theo dõi mức nguyên liệu (đơn vị gr) được sử dụng để sản suất ra một đơn vị sản phẩm của một nhà máy. Người ta thu được các số liệu quan sát sau:
20; 22; 21; 20; 22; 21; 20; 19; 20; 21; 22; 19 22; 21; 19; 20; 20; 21; 21; 19; 20; 19; 22; 22
a) Tìm khoảng ước lượng về số tiền trung bình dùng để mua loại nguyên liệu này trong từng quí của nhà máy với độ tin cậy 98%? (Biết giá loại nguyên liệu này là 900 ngàn đồng/kg và sản lượng của nhà máy trong một quí là 20000 sản phẩm)
b) Trước đây, mức nguyên liệu được sử dụng để sản xuất một sản phẩm trung bình là 22 gr/sản phẩm. Số liệu của mẫu trên được thu nhập sau khi áp dụng công nghệ sản xuất mới. Hãy cho nhận xét về công nghệ sản xuất mới với mức ý nghĩa 4%?
c) Nếu muốn ước lượng số tiền trung bình để mua nguyên liệu này trong từng quí của nhà máy đạt độ tin cậy 99% và độ chính xác là 5 triệu đồng thì cần kích thước mẫu bao nhiêu sản phẩm?
BÀI GIẢI Cỡ mẫu n= 24 Trung bình mẫu: x= 1 n k X i=1 nixi= 20,5417
Phương sai mẫu hiệu chỉnh: s2
= 1 n−1 " k X i=1 nix2i −n(x)2 # = 1,2156 Độ lệch chuẩn: s = √ s2 = 1,1025
a) Gọi m là mức nguyên liệu trung bình để sản xuất ra một sản phẩm. Đây là bài toán ước lượng trung bình với n = 24< 30 và σ2 chưa biết. Với độ tin cậy 1−α= 98%, tra bảng 4 ta sẽ tìm được tn−1