4 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
4.3 Bài toán kiểm định giả thuyết cho giá trị trung bình một mẫu
Ta nhắc lại vấn đề xác định năng suất lúa ở Thái Bình:
• Năng suất lúa trung bình của tỉnh Thái Bình năm 2015 là 66 tạ/ha.
• Khảo sát ngẫu nhiên 10 thửa ruộng ở huyện Đông Hưng thấy năng suất trung bình của 10 thửa ruộng này là 68 tạ/ha và độ lệch mẫus= 4tạ/ha.
? Có thể kết luận là năng suất lúa ở Đông Hưng cao hơn năng suất trung bình của tỉnh Thái Bình được hay khơng?
Nội dung của bài: So sánh giá trị trung bình của một quần thể với một giá trị cho trước trong
các trường hợp:
1. Mẫu có phân phối chuẩn với phương sai đã biết. 2. Mẫu cỡ lớn với phương sai chưa biết.
3. Mẫu có phân phối chuẩn với phương sai chưa biết.
4.3.1 Bài toán 1: So sánh trung bình của mẫu có phân phối chuẩn với phương saiσ2
đã biết
Giả sử(X1, . . . , Xn)là mẫu ngẫu nhiên quan sát được từ phân phối chunN(à, 2)vi2ó bit.
ã Gi thuytH0 :à=à0.
ã Thng kờ kim nh:Z0 = x−µ0
σ/√
n.
Đối thiết Tiêu chuẩn bác bỏH0ở mức ý nghĩaα
H1:µ6=µ0 |Z0|> zα/2
H1:µ > µ0 Z0> zα
H1:µ < µ0 Z0 <−zα
Ví dụ 4.3.1. • Năng suất lúa trung bình của tỉnh Thái Bình năm 2015 là 66 tạ/ha.
• Khảo sát ngẫu nhiên 10 thửa ruộng ở huyện Đơng Hưng thấy năng suất trung bình của 10 thửa ruộng này là 68 tạ/ha.
• Biết rằng năng suất của mỗi thửa ruộng có phân phối chuẩn với độ lệch chuẩnσ= 4tạ/ha. • Hãy kiểm định xem năng suất lúa ở Đơng Hưng có cao hơn năng suất trung bình của tỉnh
Thái Bình được hay khơng,cho mức ý nghĩaα= 5%?
CHƯƠNG 4. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 44 2. Ta cần kiểm định xem năng suất lúa ở Đơng Hưng có cao hơn năng suất trung bình của tỉnh
Thái Bình được hay khơng, do đó ta có bài tốn kiểm định
H0 :µ= 66 với H1 :µ >66.
3. Cỡ mẫun= 10; trung bình mẫux¯= 68; độ lệch chuẩnσ= 4. 4. Mức ý nghĩaα= 5%nênzα = 1,645.
5. Thống kê kiểm địnhZ0= 68−66 4/√
10 = 1,5811.
6. DoZ0 < zαnên ta khơng bác bỏH0:µ= 66để ủng hộH1:µ >66ở mức ý nghĩaα= 5%. Vậy ta khơng có đủ căn cứ để kết luận năng suất lúa của huyện Đơng Hưng cao hơn của tỉnh Thái Bình dựa trên mẫu gồm 10 số liệu đã thu được.
? a) Với mẫu số liệu trong Ví dụ 1, hãy kiểm định xem có sự khác biệt giữa năng suất lúa của huyện Đơng Hưng và của tỉnh Thái Bình khơng?
b) Kết luận trong Ví dụ 1 có thay đổi khơng trong mỗi trường hợp sau: (i) Độ lệch chuẩnσ = 2.
(ii) Cỡ mẫun= 50.
4.3.2 Bài toán 2: So sánh giá trị trung bình của mẫu cỡ lớn với phương sai chưa biết
Giả sử(X1, . . . , Xn)là mẫu ngẫu nhiên quan sỏt c t qun th cú trung bỡnhàvn30.
ã Gi thuytH0 :à=à0.
ã Thng kờ kim nh:Z0 = xà0
s/
n.
i thit Tiờu chun bác bỏH0ở mức ý nghĩaα
H1:µ6=µ0 |Z0|> zα/2
H1:µ > µ0 Z0> zα
H1:µ < µ0 Z0 <−zα
Ví dụ 4.3.2. Trọng lượng ghi trên bao bì của mỗi gói mì chính là2kg. Lấy mẫu ngẫu nhiên gồm 100gói thì thấy trọng lượng trung bình của100gói này là2002g và độ lệch mẫus= 5g. Với mức ý nghĩaα= 0,05hãy cho biết trọng lượng các gói mì chính có đúng như cơng bố khơng?
Lời giải. 1. Tham số cần kiểm định là trọng lượng trung bình của mỗi gói mì chính, kí hiệu là
µgam.
2. Ta cần kiểm định xem trọng lượng các gói mì chính có đúng như cơng bố khơng, do đó ta có bài tốn kiểm định
H0:µ= 2000 với H1 :µ6= 2000. 3. Cỡ mẫun= 100; trung bình mẫux¯= 2002; độ lệch mẫus= 5. 4. Mức ý nghĩaα= 5%nênzα/2= 1,96.
5. Tiêu chuẩn kiểm định:
Z0= 2002−2000
5/√
100 = 4.
6. Do|Z0|> zα/2nên ta bác bỏH0 :µ= 2000để ủng hộH1:µ6= 2000ở mức ý nghĩaα= 5%. Vậy ta có đủ căn cứ để kết luận rằng trọng lượng của mỗi gói mì chính khơng giống như trong công bố của nhà sản xuất dựa trên mẫu 100 số liệu đã thu được.
4.3.3 Bài toán 3: So sánh giá trị trung bình của mẫu có phân phối chuẩn với phương sai chưa biết
Giả sử (X1, . . . , Xn) là mẫu ngẫu nhiên quan sát được từ phõn phi chunN(à, 2) vi 2
cha bit.
ã Gi thuytH0 :à=à0.
ã Thống kê kiểm định:T0 = x−µ0
s/√
n.
Đối thiết Tiêu chuẩn bác bỏH0ở mức ý nghĩaα
H1:µ6=µ0 |T0|> tα/2;n−1
H1:µ > µ0 T0 > t;n1
H1:à < à0 Z0<t;n1
Chỳ ý: Khin >100thỡt;nz.
Vớ d 4.3.3. ã Năng suất lúa trung bình của tỉnh Thái Bình năm 2015 là 66 tạ/ha.
• Khảo sát ngẫu nhiên 10 thửa ruộng ở huyện Đơng Hưng thấy năng suất trung bình của 10 thửa ruộng này là 68 tạ/ha vàđộ lệch mẫus= 4tạ/ha.
• Biết rằng năng suất của mỗi thửa ruộng có phân phối chuẩn.
• Hãy kiểm định xem năng suất lúa ở Đơng Hưng có cao hơn năng suất trung bình của tỉnh Thái Bình được hay khơng,cho mức ý nghĩaα= 5%?
CHƯƠNG 4. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 46 2. Ta cần kiểm định xem năng suất lúa ở Đơng Hưng có cao hơn năng suất trung bình của tỉnh
Thái Bình được hay khơng, do đó ta có bài tốn kiểm định
H0 :µ= 66 với H1 :µ >66.
3. Cỡ mẫun= 10; trung bình mẫux¯= 68;độ lệch mẫus= 4. 4. Mức ý nghĩaα= 5%nêntα;n−1=t0,05;9= 1,833.
5. Thống kê kiểm địnhT0 = 68−66 4/√
10 = 1,5811.
6. DoT0 < tα;n−1 nên ta khơng bác bỏH0 : µ = 66để ủng hộH1 : µ > 66ở mức ý nghĩa
α= 5%.
Vậy ta khơng có đủ căn cứ để kết luận năng suất lúa của huyện Đông Hưng cao hơn của tỉnh Thái Bình dựa trên mẫu gồm 10 số liệu đã thu được.
Luyện tập
4.3.1. Trước đây trung bình thời gian gia cơng một chi tiết máy là 10 phút. Sau khi cải tiến phương pháp, có ý kiến cho rằng, thời gian gia cơng một chi tiết máy có giảm xuống. Để kết luận được vấn đề này, người ta khảo sát thời gian gia công chi tiết máy của25công nhân và thu được bảng số liệu sau:
X 9,3 9,5 9,7 9,8 10 10,2 10,4 10,6 Số công nhân 3 2 5 4 4 3 2 2
Với mức ý nghĩa0,05hãy kiểm định xem ý kiến trên có đúng khơng, biết rằng thời gian gia cơng có phân phối chuẩn với độ lệch chuẩnσ= 0,2phút.
Lời giải. 1. Tham số cần kiểm định là thời gian gia cơng trung bình của một chi tiết máy, kí hiệu làµphút.
2. Ta cần kiểm định xem thời gian gia công một chi tiết máy có giảm xuống được hay khơng, do đó ta có bài tốn kiểm định
H0 :µ= 10 với H1 :µ <10.
3. Cỡ mẫun= 25; trung bình mẫux¯= 9,888;độ lệch chuẩnσ= 0,04. 4. Mức ý nghĩaα= 5%nênzα = 1,645.
5. Thống kê kiểm địnhZ0= x−µ0 σ/√ n = (9,888−10)√ 25 0,2 =−2,8. 6. DoZ0 <−zαnên ta bác bỏH0 :µ= 10để ủng hộH1 :µ <10ở mức ý nghĩaα= 5%. Vậy ta có đủ căn cứ để kết luận rằng thời gian gia cơng một chi tiết máy có giảm xuống dựa trên mẫu gồm25số liệu thu được.
4.3.2. Cự ly ném tạ trung bình của nữ sinh trường A là 12m. Khảo sát kết quả của36nữ sinh trường B thu được số liệu:
X (m) 11,2 11,5 11,8 12 12,3 12,6 13 13,2
Số sinh viên 5 5 5 4 4 5 4 4
Với mức ý nghĩa5%hãy cho biết cự ly ném tạ trung bình của sinh viên hai trường có như nhau khơng?
Lời giải. 1. Tham số cần kiểm định là cự ly ném tạ trung bình của nữ sinh trường B, kí hiệu là
µ.
2. Ta cần kiểm định xem cự ly ném tạ trung bình của nữ sinh hai trường có như nhau khơng, do đó ta có bài tốn kiểm định
H0 :µ= 12 với H1 :µ6= 12. 3. Cỡ mẫun= 36; trung bình mẫux¯= 12,15; độ lệch mẫus= 0,7203. 4. Mức ý nghĩaα= 5%nênzα/2= 1,96. 5. Thống kê kiểm địnhZ0= x−µ0 σ/√ n = (12,15−12)√ 36 0,7203 = 1,249.
6. Do|Z0|< zαnên ta khơng bác bỏH0:µ= 12để ủng hộH1:µ6= 12ở mức ý nghĩaα= 5%. Vậy ta khơng có đủ căn cứ để kết luận rằng cự ly ném tạ trung bình của nữ sinh hai trường là khác nhau dựa trên mẫu gồm36số liệu thu được.
4.3.3. Năm ngối, trọng lượng trung bình sau 4 tháng tuổi của lợn là90kg. Năm nay, người ta đổi mới phương pháp chăn ni, nên có ý kiến cho rằng trọng lượng trung bình năm nay cao hơn năm ngối. Để kết luận được vấn đề, người ta đem cân thử25con lợn 4 tháng tuổi thì thu được
CHƯƠNG 4. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 48 Hãy kiểm định xem ý kiến trên có đúng khơng, cho mức ý nghĩaα= 5%.
Lời giải. 1. Tham số cần kiểm định là trọng lượng trung bình sau 4 tháng tuổi của lợn, kí hiệu làµkg.
2. Ta cần kiểm định xem trọng lượng trung bình năm nay cao hơn năm ngối hay khơng, do đó ta có bài tốn kiểm định
H0 :µ= 90 với H1 :µ >90.
3. Cỡ mẫun= 25; trung bình mẫux¯= 90,6; độ lệch mẫus= 1,67. 4. Mức ý nghĩaα= 5%nêntα,n−1=t0,05;24 = 1,71.
5. Thống kê kiểm địnhT0 = (90,6−90)√
25
1,67 ≈1,796.
6. DoT0> tα,n−1nên ta bác bỏH0 :µ= 90để ủng hộH1:µ6= 90ở mức ý nghĩaα= 5%. Vậy ta có đủ căn cứ để kết luận rằng trọng lượng trung bình của giống lợn đó có tăng lên dựa trên mẫu gồm25số liệu thu được.