C 9 a) Tớnh tỷ lệ phần trăm cỏc giỏ trị trong mỗi nhúm
Chương 7 KIấ̉M ĐỊNH GIẢ THUYấ́T 7.1 Giới thiệu chung
7.9 Kiểm định tớnh bằng nhau của hai tỷ lệ của hai tổng thể
Giả sử cú hai tổng thể X và Y
Gọi nx, ny lần lượt là kớch thước của hai mẫu được lấy ngẫu nhiờn từ hai tổng thể X và Y Px, Py và , lần lượt là tỷ lệ cỏc đơn vị cú tớnh chất nào đú mà chỳng ta quan tõm trong hai tổng thể và trong hai mẫu.
Cỏc điều kiện:
- Hai mẫu ngẫu nhiờn độc lập - nx , ny ≥ 30
Bước thực hiện Bài toỏn kiểm định hai bờn
Bài toỏn kiểm định bờn trỏi
Bài toỏn kiểm định bờn phải
Phỏt biểu giả thuyết
Lựa chọn α
Đại lượng kiểm định Miền bỏc bỏ H0: px = py H1: px ≠ py z < -zα/2 hoặc z > zα/2 H0: px ≥ py H1: px < py z < -zα H0: px ≤ py H1: px > py z > zα Trong đú Vớ dụ
Một cụng ty vừa mới thực hiện một chương trỡnh quảng cỏo trờn TV để khuếch trương một trong cỏc sản phẩm của họ. Một mẫu ngẫu nhiờn 240 người được lấy ra trước khi quảng cỏo cho thấy cú 60 người đó sử dụng sản phẩm của cụng ty. Một mẫu ngẫu nhiờn khỏc 360 người được lấy ra sau quảng cỏo, cho thấy cú 117 người đó sử dụng sản phẩm của cụng ty.
Hóy kiểm định xem liệu cú bằng chứng của sự tăng lờn đỏng kể về tỷ lệ số người đó sử dụng sản phẩm đú của cụng ty sau quảng cỏo hay khụng, sử dụng α = 0,01.
Giải
Đặt giả thuyết H0: Px = Py H1: Px < Py
X là tổng thể trước quảng cỏo, Y là tổng thể sau quảng cỏo. Tớnh đại lượng kiểm định
Với α=0,01, ta cú Zα = 2,33
Miền bỏc bỏ với cỏc giỏ trị < - 2,33. Vậy khụng cú đủ bằng chứng để bỏc bỏ H0, chương trỡnh quảng cỏo khụng làm tăng tỷ lệ số người sử dụng sản phẩm của cụng ty , với độ tin cậy 99%. Khoảng tin cậy (1-α).100% cho sự khỏc biệt giữa tỷ lệ của hai tổng thể trong trường hợp mẫu lớn:
7.10 Ứng dụng vi tớnh
BÀI TẬP
1. Giỏm đốc sản xuất tại một nhà mỏy dệt cần xỏc định xem liệu một chiếc mỏy mới đang sản xuất ra một loại vải cú phự hợp với cỏc tiờu chuẩn của nhà sản xuất hay khụng, mà nú chỉ ra rằng loại vải này nờn cú độ bền là 70 pounds và độ lệch chuẩn là 3,5 pounds. Một mẫu ngẫu nhiờn 49 mảnh vải cho thấy độ bền trung bỡnh mẫu là 69,1 pounds.
a) Liệu cú bằng chứng là chiếc mỏy đú khụng đỏp ứng cỏc tiờu chuẩn của nhà sản xuất về độ bền hay khụng? ( sử dụng mức ý nghĩa 0,05)
b) Tớnh p-value và giải thớch ý nghĩa
2. Chỳng ta là người quản lý một cửa hàng mà chuyờn phõn phỏt bỏnh khỳc đến cỏc ký tỳc xỏ của sinh viờn. Chỳng ta vừa mới thay đổi quỏ trỡnh phõn phỏt của chỳng ta nhằm làm giảm thời gian trung bỡnh giữa đặt hàng và hoàn thành việc giao hàng hiện tại là 25 phỳt. Theo kinh nghiệm chỳng ta cú thể giả sử độ lệch chuẩn tổng thể là 6 phỳt. Mộ mẫu ngẫu nhiờn 36 đơn hàng sử dụng quỏ trỡnh phõn phỏt mới cho thấy trung bỡnh mẫu là 22,4 phỳt.
a) Sử dụng cỏch tiếp cận miền bỏc bỏ, tại mức ý nghĩa 5%, liệu cú bằng chứng rằng thời gian phõn phỏt trung bỡnh đó được giảm xuống dưới giỏ trị trung bỡnh tổng thể so với trước đõy là 25 phỳt hay khụng?
b) Tại mức ý nghĩa 5%, hóy sử dụng cỏch tiếp cận p-value? c) Giải thớch ý nghĩa của p-value trong b)
d) So sỏnh cỏc kết luận trong a) và b)?
3. Chỳng ta là người quản lý một nhà hàng thức ăn nhanh (fast-food restaurant). Thỏng vừa qua, thời gian đợi trung bỡnh, tớnh từ khi một khỏch hàng đặt hàng cho đến khi khỏch hàng đú nhận được thực đơn, là 3,7 phỳt. Chỳng ta thay đổi quỏ trỡnh cung cấp dịch vụ nhằm giảm thời gian chờ đợi của khỏch hàng. Chỳng ta lựa chọn ngẫu nhiờn 64 đơn hàng. Thời gian đợi trung bỡnh mẫu là 3,57 phỳt với độ lệch chuẩn mẫu là 0,8 phỳt. Với mức ý nghĩa 0,05, liệu cú bằng chứng là thời gian đợi chờ trung bỡnh tổng thể bõy giờ là nhỏ hơn 3,7 phỳt hay khụng? 4. Cỏc thành kiến về tuổi tỏc đang trở thành một vấn đề lớn trong thế giới doanh nhõn. Trong năm 2011, khoảng 78% cỏc nhà quản lý điều hành (executives) tin tưởng rằng cỏc thành kiến về tuổi tỏc là một vấn đề nghiờm trọng. Một nghiờn cứu trong năm 2015 bởi ExecuNet, 82% cỏc executives được điều tra cho rằng thành kiến về tuổi tỏc là một vấn đề nghiờm trọng. Kớch thước mẫu cho nghiờn cứu năm 2015 đó khụng được tiết lộ. Giả sử 50 executives đó được điều tra.
a) Với mức ý nghĩa 0,05, sử dụng cỏch tiếp cận miền bỏc bỏ, hóy chứng minh rằng tỷ lệ cỏc executives mà tin tưởng rằng cỏc thành kiến về tuổi tỏc là một vấn đề nghiờm trọng là cao hơn so với gias trị của năm 2011 là 0,78.
b) Sử dụng cỏch tiếp cận p-value. Giải thớch ý nghĩa của p-value. c) Giả sử rằng kớch thước mẫu là 1000. Làm lại cỏc cõu a) và b).
d) Hóy thảo luận sự ảnh hưởng của kớch thước mẫu lờn kết quả của phõn tớch này, và núi chung, sự ảnh hưởng của kớch thước mẫu lờn kiểm định giả thuyết.
5. Trưởng phũng quản lý chất lượng tại một nhà mỏy búng đèn muốn xỏc định xem liệu tuổi thọ trung bỡnh của một loạt lớn sản phẩm cú phải là 375 giờ hay khụng. Độ lệch chuẩn tổng thể là 100 giờ. Một mẫu ngẫu nhiờn 64 búng đèn cho thấy trung bỡnh mẫu là 350h.
a) Tại mức ý nghĩa 0,05, liệu cú bằng chứng rằng tuổi thọ trung bỡnh là khỏc 375h? b) Tớnh p-value và giải thớch ý nghĩa.
c) Xỏc định khoảng tin cậy 95% cho tuổi thọ trung bỡnh của cỏc búng đèn? d) So sỏnh cỏc kết quả của cõu a) và cõu c). Cú thể rỳt ra kết luận gỡ?
6. Trưởng cửa hàng sơn muốn xỏc định xem liệu trọng lượng sơn trung bỡnh trong những can sơn dung tớch 10 lớt được mua từ một hóng sơn nổi tiếng quốc gia là đỳng 10 lớt hay khụng. Từ cỏc tiờu chuẩn của nhà sản xuất, chỳng ta biết độ lệch chuẩn của trọng lượng sơn là 0,2 lớt. Chỳng ta lấy một mẫu ngẫu nhiờn 50 can, và trọng lượng trung bỡnh mỗi can loại 10 lớt là 9,95 lớt.
a) Tại mức ý nghĩa 0,01, liệu cú bằng chứng rằng trọng lượng trung bỡnh mỗi can là khỏc 10 lớt?
b) Tớnh p-value và giải thớch ý nghĩa.
c) Xỏc định khoảng tin cậy 99% cho tuổi thọ trung bỡnh của cỏc búng đèn? d) So sỏnh cỏc kết quả của cõu a) và cõu c). Cú thể rỳt ra kết luận gỡ?
7. Cỏc mỏy ATM phải dự trữ tiền đủ để đỏp ứng việc rỳt tiền của cỏc khỏch hàng trong toàn bộ khoảng thời gian cuối tuần. Nhưng nếu quỏ nhiều tiền là khụng cần thiết giữ trong cỏc mỏy ATM, ngõn hàng sẽ mất cơ hội đầu tư tiền và hưởng lói suất. Giả sử rằng tại một chi nhỏnh nhất định lượng tiền trung bỡnh tổng thể được rỳt từ những chiếc mỏy ATM bởi mỗi giao dịch của khỏch hàng trong khoảng thời gian cuối tuần là 1,6 triệu đồng với độ lệch chuẩn tổng thể là 0,3 triệu đồng.
a) Nếu một mẫu ngẫu nhiờn 36 giao dịch của khỏch hàng cho thấy rằng trung bỡnh mẫu là 1,72 triệu đồng, liệu cú bằng chứng để tin tưởng rằng trung bỡnh tổng thể khụng lớn hơn 1,6 triệu đồng? sử dụng mức ý nghĩa 0,05.
b) Tớnh p-value và giải thớch ý nghĩa.
c) Cõu trả lời trong b) là gỡ nếu sử dụng mức ý nghĩa 0,01? d) Cõu trả lời trong b) là gỡ nếu độ lệch chuẩn là 0,24 triệu đồng?
8. Cụng ty Việt Ý sản xuất những thanh sắt. Nếu quỏ trỡnh sản xuất khụng chớnh xỏc, nú tạo ra những thanh sắt cú độ dài trung bỡnh ớt nhất là 2,8 một với độ lệch chuẩn 0,2m. Những thanh sắt dài hơn cú thể được sử dụng hoặc thay thế, nhưng những thanh sắt ngắn hơn phải bị loại ra. Chỳng ta lựa chọn một mẫu 25 thanh và độ dài trung bỡnh là 2,73m. Chỳng ta cú cần điều chỉnh quỏ trỡnh sản xuất?
a) Nếu chỳng ta muốn kiểm định giả thuyết tại mức ý nghĩa 0,05, chỳng ta sẽ rỳt ra quyết định gỡ khi sử dụng cỏch tiếp cận miền bỏc bỏ?
b) Nếu chỳng ta muốn kiểm định giả thuyết tại mức ý nghĩa 0,05, chỳng ta sẽ rỳt ra quyết định gỡ khi sử dụng cỏch tiếp cận p-value?
c) Giải thớch ý nghĩa của p-value trong vấn đề này? d) So sỏnh cỏc kết luận rỳt ra trong a) và trong b)?
Kiểm định làm việc với hai tổng thể
9. Văn phũng Hội Sinh viờn của một trường đại học đó điều tra một mẫu ngẫu nhiờn đơn giản những sinh viờn đại học nhằm nghiờn cứu tỡnh trạng làm thờm trong mựa hè của họ. Kết quả đối với cỏc sinh viờn nam và nữ như sau:
Nam: 403 người được thuờ 77 người khụng được thuờ Nữ : 456 người được thuờ 64 người khụng được thuờ
Hóy xỏc định khoảng tin cậy 99% cho sự khỏc biệt về tỷ lệ của những sinh viờn nam và nữ, những người đó làm thuờ trong mựa hè. Dựa vào khoảng tin cậy này, liệu sự khỏc biệt này là đỏng kể hay khụng? Giải thớch.
10. Thời gian chạy của 60 chiếc đĩa CD đó được đo lường. 60 chiếc đĩa CD được lấy ngẫu nhiờn từ hai tổng thể: 30 chiếc được lấy ra từ một bộ sưu tầm nhạc mạnh và 30 đĩa được lầy ra từ một bộ sưu tầm nhạc trẻ (nhạc hip-hop). Cỏc số thống kờ túm tắt là:
Nhạc mạnh: n1 = 30 x1=54phỳt s1 = 7 phỳt Nhạc hip-hop: n2 = 30 x2 =48phỳt s2 = 8 phỳt
a) Hóy kiểm định giả thuyết rằng cỏc tổng thể của tất cả cỏc đĩa CD nhạc mạnh và nhạc hip-hop cú thời gian chạy trung bỡnh là như nhau sử dụng mức ý nghĩa 1%.
c) Tỡm khoảng tin cậy 90% cho thời gian chạy trung bỡnh của cỏc đĩa CD nhạc mạnh và khoảng tin cậy 90% cho thời gian chạy trung bỡnh của cỏc đĩa CD nhạc hip-hop. Biểu diễn cỏc khoảng tin cậy này trờn một trục tọa độ và rỳt ra nhận xột.
11. Người lỏi chiếc xe ụ tụ inova nghi ngờ rằng cỏc dữ liệu tiờu thụ nhiờn liệu của anh ta bao gồm hai loại sử dụng: lỏi xe đường dài và lỏi xe trong nội thành. Cỏc dữ liệu là:
Lỏi xe đường dài 11,6 11,1 10,7 11,6 11,5 11,3 10,1 11,6 10,5 10,5 10,9 11,0 10,6 10,6 10,8
Lỏi xe trong nội thành 9,6 9,6 8,5 8,5 9,7 9,3 9,3 10,3 8,6 10,2 8,2 8,7 9,4 8,5 10,1
a) Hóy kiểm định xem liệu lượng tiờu thụ nhiờn liệu của chiếc xe là tốn hơn một cỏch đỏng kể khi lỏi xe trong nội thành hay khụng. Sử dung mức ý nghĩa 5%.
b) Hóy vẽ biểu đồ hỡnh hộp cho hai nhúm trờn. Liệu cỏc giả thuyết của kiểm định của chỳng ta cú được đỏp ứng?
12. Một cụng ty vừa mới thực hiện một chương trỡnh quảng cỏo trờn TV để khuếch trương cho một trong cỏc sản phẩm của họ.
i) Một mẫu ngẫu nhiờn 240 người đó được lấy ra trước khi chương trỡnh quảng cỏo được thực hiện, cú 60 người đó từng sử dụng sản phẩm của cụng ty. Xỏc định khoảng tin cậy 90% cho tỷ lệ số người trong tổng thể đó sử dụng sản phẩm của cụng ty.
ii) Một mẫu ngẫu nhiờn khỏc 360 người, được lấy ra sau khi chương trỡnh quảng cỏo được thực hiện, cú 117 người đó sử dụng sản phẩm đú của cụng ty. Hóy kiểm định xem liệu cú bằng chứng về sự tăng lờn đỏng kể số người sử dụng sản phẩm của cụng ty.
13. i) Giải thớch thuật ngữ phõn phối mẫu.
ii) Một mẫu ngẫu nhiờn 200 húa đơn bỏn hàng được lập bởi một nhõn viờn bỏn hàng của một cụng ty cho thấy cú 24 lỗi.
Hóy xỏc định khoảng tin cậy 95% cho tỷ lệ cỏc húa đơn cú chứa lỗi mà được lập bởi nhõn viờn trờn.
iii) Một mẫu ngẫu nhiờn 200 húa đơn bỏn hàng được lập bởi một nhõn viờn khỏc trong cụng ty cú chứa 18 lỗi.
Hóy kiểm định xem liệu cú bằng chứng về sự khỏc biệt đỏng kể giữa tỷ lệ lỗi của hai nhõn viờn trờn hay khụng?
14. Một chiếc mỏy bỏn nước giải khỏt hoạt động bằng tiền xu được thiết kế để chảy ra ớt nhất là 70ml nước giải khỏt mỗi cốc với độ lệch chuẩn 2ml. Nếu chỳng ta lựa chọn một mẫu ngẫu nhiờn 16 cốc và chỳng ta sẵn sàng chấp nhận mức rủi ro α = 0,05 đối với sai số kiểu I, hóy tớnh power of the test và xỏc suất của sai số kiểu II (β) nếu giỏ trị trung bỡnh tổng thể được phõn phỏt thực tế là
a) 69ml mỗi cốc b) 68ml mỗi cốc.
14. Trở lại bài số 9. Nếu chỳng ta sẵn sàng chấp nhận mức rủi ro α = 0,01 đối với sai số kiểu I, hóy tớnh power of the test và xỏc suất của sai số kiểu II (β) nếu giỏ trị trung bỡnh tổng thể được phõn phỏt thực tế là
a) 69ml mỗi cốc b) 68ml mỗi cốc.
c) So sỏnh cỏc kết quả trong a) và b) của bài này và trong bài 9. Chỳng ta cú thể rỳt ra kết luận gỡ?
14. Trở lại bài số 9. Nếu chỳng ta lấy mẫu ngẫu nhiờn kớch thước 25 cốc và sẵn sàng chấp nhận mức rủi ro α = 0,05 đối với sai số kiểu I, hóy tớnh power of the test và xỏc suất của sai số kiểu II (β) nếu giỏ trị trung bỡnh tổng thể được phõn phỏt thực tế là
a) 69ml mỗi cốc b) 68ml mỗi cốc.
c) So sỏnh cỏc kết quả trong a) và b) của bài này và trong bài 9. Chỳng ta cú thể rỳt ra kết luận gỡ?