1. Trang chủ
  2. » Khoa Học Tự Nhiên

Đáp ánbài tập ôn xác suất thống kê

24 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 24
Dung lượng 511,25 KB

Nội dung

Giải chi tiết bài tập xác suất thống kê lớp Đại Học Khoa Học Tự Nhiên. Bao gồm nhiều dạng khác nhau đa dạng về cách giải chi tiết xác suất thống kê, Giải bài tập xác suất thống kê nhóm các bạn đại học tự biên soạn, mang tính chất tham khảo....

Dạng 1: Ước lượng trung bình tổng thể Bài tập giáo trình: Từ 4.14 – 4.54 Bài tập thêm: The yield of a chemical process is being studied From previous experience, yield is known to be normally distributed and 𝜎 = The past five days of plant operation have resulted in the following percent yields: 91.6, 88.75, 90.8, 89.95, and 91.3 Find a 95% two-sided confidence interval on the true mean yield (Sản lượng q trình hóa học nghiên cứu Theo kinh nghiệm trước đây, suất có phân phối chuẩn với σ = Sau ngày vận hành, sản lượng thu có phần trăm sau: 91,6, 88,75, 90,8, 89,95 91,3 Tìm khoảng tin cậy 95% cho suất trung bình q trình hóa học trên.) Bài làm Gọi X suất q trình hóa học Theo đề bài, ta có: 𝑋 ∼ 𝑁(𝜇, 𝜎 ) 𝜎=3 Dựa kiện đề bài, ta tính được: 𝑛 = (𝑛 < 30) 𝑥̅ = 90.48 Gọi 𝜇 suất trung bình q trình hóa học Thống kê: 𝑍 = 𝑋̅ −𝜇 𝜎 √𝑛 ∼ 𝑁(0,1) Với độ tin cậy 95%, ta có: 𝛼 = 0.05 ⇒ 𝑧1−𝛼 = 𝑧 1− 0.05 = 𝑧0.975 = 1.96 Sai số ước lượng: 𝜖 = 𝑧1−𝛼 × 𝜎 √𝑛 = 1.96 × √5 = 2.63 Khoảng tin cậy 95% cho trung bình 𝜇 là: 𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖 ⇔ 90.48 − 2.63 < 𝜇 < 90.48 + 2.63 ⇔ 87.85 < 𝜇 < 93.11 Vậy: Khoảng tin cậy 95% cho suất trung bình trình hóa học (87.85; 93.11)% The life in hours of a 75-watt light bulb is known to be normally distributed with 𝜎 = 25 hours A random sample of 20 bulbs has a mean life of 𝑥̅ = 1014 hours (a) Construct a 95% two-sided confidence interval on the mean life (b) Suppose that you wanted the total width of the two-sided confidence interval on mean life to be six hours at 95% confidence What sample size should be used? (Tuổi thọ bóng đèn 75W biết có phân phối chuẩn với 𝜎 = 25 Một mẫu gồm 20 bóng đèn có tuổi thọ trung bình 𝑥̅ = 1014 a) Hãy tìm khoảng tin cậy 95% cho trung bình tuổi thọ bóng đèn 75W b) Giả sử sai số ước lượng phải số bóng đèn cần phải sử dụng bao nhiêu?) Bài làm a) Gọi X tuổi thọ bóng đèn Theo đề bài, ta có: 𝑋 ∼ 𝑁(𝜇, 𝜎 ) 𝜎 = 25 Dựa kiện đề bài, ta tính được: 𝑛 = 20 (𝑛 < 30) 𝑥̅ = 1014 Gọi 𝜇 tuổi thọ trung bình bóng đèn 75W Thống kê: 𝑍 = 𝑋̅ −𝜇 𝜎 √𝑛 ∼ 𝑁(0,1) Với độ tin cậy 95%, ta có: 𝛼 = 0.05 ⇒ 𝑧1−𝛼 = 𝑧 1− 0.05 = 𝑧0.975 = 1.96 Sai số ước lượng: 𝜖 = 𝑧1−𝛼 × 𝜎 √𝑛 = 1.96 × 25 √20 = 10.96 Khoảng tin cậy 95% cho trung bình 𝜇 là: 𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖 ⇔ 1014 − 10.96 < 𝜇 < 1014 + 10.96 ⇔ 1003.04 < 𝜇 < 1024.96 Vậy: Khoảng tin cậy 95% cho tuổi thọ trung bình bóng đèn 75W (1003.04; 1024.96) b) Sai số ước lượng với độ tin cậy 95% nghĩa là: 𝜖=6 ⇔ 𝑧0.975 × ⇔ 1.96 × 𝜎 √𝑛 25 √𝑛 =6 =6 ⇔ 𝑛 = 66.69 Vậy cần sử dụng 67 bóng đèn 75W để sai số ước lượng A civil engineer is analyzing the compressive strength of concrete Compressive strength is normally distributed with 𝜎 = 1000 (𝑝𝑠𝑖)2 A random sample of 12 specimens has a mean compressive strength of 𝑥̅ = 3250 psi (a) Construct a 95% two-sided confidence interval on mean compressive strength (b) Suppose that it is desired to estimate the compressive strength with an error that is less than 15 psi at 99% confidence What sample size is required? (Một kỹ sư cơng trình phân tích cường độ nén bê tơng Cường độ có phân phối chuẩn với 𝜎 = 1000 (𝑝𝑠𝑖)2 Một mẫu ngẫu nhiên gồm 12 mẫu thử có cường độ nén trung bình 𝑥̅ = 3250 psi (a) Xây dựng khoảng tin cậy hai phía 95% cường độ nén trung bình (b) Giả sử trong, người ta muốn ước tính cường độ nén với sai số nhỏ 15 psi với độ tin cậy 99% cần phân tích mẫu?) Bài làm a) Gọi X cường độ nén bê tơng Theo đề bài, ta có: 𝑋 ∼ 𝑁(𝜇, 𝜎 ) 𝜎 = 1000 ⇒ 𝜎 = 10√10 𝑛 = 12 < 30 𝑥̅ = 3250 Gọi 𝜇 cường độ nén trung bình bê tông Thống kê: 𝑍 = 𝑋̅ −𝜇 𝜎 √𝑛 ∼ 𝑁(0,1) Với độ tin cậy 99%, ta có: 𝛼 = 0.01 ⇒ 𝑧1−𝛼 = 𝑧1−0.01 = 𝑧0.995 = 2.575 2 Sai số ước lượng: 𝜖 = 𝑧1−𝛼 × 𝜎 √𝑛 = 2.575 × 10√10 √12 = 23.51 Khoảng tin cậy 99% cho trung bình 𝜇 là: 𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖 ⇔ 3250 − 23.51 < 𝜇 < 3250 + 23.51 ⇔ 3226.49 < 𝜇 < 3273.51 Vậy: Khoảng tin cậy 99% cho cường độ nén bê tơng trung bình (3226.49; 3273.51) psi b) Sai số nhỏ 15 với khoảng tin cậy 99% nghĩa là: 𝜖 < 15 ⇔ 𝑧0.995 × ⇔ 2.575 × 𝜎 √𝑛 < 15 10√10 √𝑛 < 15 ⇔ 𝑛 > 29.47 Vậy: Muốn tính sai số ước lượng nhỏ 15 psi cần khảo sát 30 mẫu A healthcare provider monitors the number of CAT scans performed each month in each of its clinics The most recent year of data for a particular clinic follows (the reported variable is the number of CAT scans each month expressed as the number of CAT scans per thousand members of the health plan): 2.31, 2.09, 2.36, 1.95, 1.98, 2.25, 2.16, 2.07, 1.88, 1.94, 1.97, 2.02 (a) Find a 95% two-sided CI on the mean number of CAT scans performed each month at this clinic (b) Historically, the mean number of scans performed by all clinics in the system has been 1.95 If there any evidence that this clinic performs more CAT scans on average than the overall system average? (Một nhà cung cấp dịch vụ chăm sóc sức khỏe giám sát số lần quét CAT thực tháng phòng khám họ Dữ liệu năm gần cho phòng khám cụ thể theo sau (biến báo cáo số lần quét CAT tháng biểu thị số lần quét CAT nghìn thành viên kế hoạch sức khỏe):2,31, 2,09, 2,36, 1,95, 1,98, 2,25, 2,16, 2,07, 1,88, 1,94, 1,97, 2,02 (a) Tìm khoảng tin cậy 95% số lần quét CAT trung bình thực tháng phòng khám (b) Trước đây, số lần quét trung bình thực tất phịng khám hệ thống 1,95 Có chứng cho thấy phòng khám cụ thể thực nhiều lần quét CAT mức trung bình tồn hệ thống?) Bài làm Gọi X số lần quét CAT tháng Theo kiện đề bài, ta tính được: 𝑛 = 12 (𝑛 < 30) 𝑥̅ = 2.082 𝑠 = 0.156 a) Gọi 𝜇 số lần quét CAT trung bình tháng Thống kê: 𝑇 = 𝑋̅ −𝜇 𝑆 √𝑛 ∼ 𝑇𝑛−1 (với 𝑛 = 12) Với độ tin cậy 95%, ta có: 𝛼 = 0.05 𝑛−1 12−1 11 ⇒ 𝑡1− 𝛼 = 𝑡 0.05 = 𝑡0.975 = 2.201 1− 𝑛−1 Sai số ước lượng: 𝜖 = 𝑡1− 𝛼 × 𝑠 √𝑛 = 2.201 × 0.156 √12 = 0.099 Khoảng tin cậy 95% cho trung bình 𝜇 là: 𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖 ⇔ 2.082 − 0.099 < 𝜇 < 2.082 + 0.099 ⇔ 1.983 < 𝜇 < 2.181 Vậy: Khoảng tin cậy 95% cho số lần qt CAT trung bình dịch vụ chăm sóc sức khỏe (1.983; 2.181) lần b) Vì 1.95 < (1.983; 2.181) Vậy: Với độ tin cậy 95%, khẳng định phòng khám thực quét CAT nhiều trung bình tồn hệ thống The wall thickness of 25 glass 2-liter bottles was measured by a quality-control engineer The sample mean was 𝑥̅ = 4.05 millimeters, and the sample standard deviation was s = 0.08 millimeter Find a 95% lower confidence bound for mean wall thickness (Độ dày thành 25 chai thủy tinh lít đo kỹ sư quản lý chất lượng Giá trị trung bình mẫu 𝑥̅ = 4.05 mm độ lệch chuẩn mẫu s = 0.08 mm Tìm khoảng tin cậy 95% cho độ dày trung bình thành chai.) Bài làm Gọi X độ dày thành chai Theo đề bài, ta có: 𝑛 = 25 (𝑛 < 30) 𝑥̅ = 4.05 s = 0.08 Gọi 𝜇 cường độ dịng điện trung bình chạy qua ống hình tivi Thống kê: 𝑇 = 𝑋̅ −𝜇 𝑆 √𝑛 ∼ 𝑇𝑛−1 (với 𝑛 = 25) Với độ tin cậy 95%, ta có: 𝛼 = 0.05 𝑛−1 25−1 24 ⇒ 𝑡1− 𝛼 = 𝑡 0.05 = 𝑡0.975 = 2.0639 1− 𝑛−1 Sai số ước lượng: 𝜖 = 𝑡1− 𝛼 × 𝑠 √𝑛 = 2.0639 × 0.08 √25 = 0.033 Khoảng tin cậy 95% cho trung bình 𝜇 là: 𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖 ⇔ 4.05 − 0.033 < 𝜇 < 4.05 + 0.033 ⇔ 4.017 < 𝜇 < 4.083 Vậy: Khoảng tin cậy 99% cho độ dày trung bình chai (4.017; 4.083) 𝑚𝑚 An article in Medicine and Science in Sports and Exercise [“Maximal Leg-Strength Training Improves Cycling conomy in Previously Untrained Men” (2005, Vol 37, pp 131–136)] studied cycling performance before and after eight weeks of egstrength training Seven previously untrained males performed leg-strength training three days per week for eight weeks (with four sets of five replications at 85% of one repetition maximum) Peak power during incremental cycling increased to a mean of 315 watts with a standard deviation of 16 watts Construct a 95% confidence interval for the mean peak power after training (Một báo Tạp chí Y học Khoa học Thể dục thể thao nghiên cứu thành tích đạp xe trước sau tuần tập luyện sức bền Bảy nam giới chưa đào tạo trước thực tập sức mạnh chân ba ngày tuần tám tuần (với bốn hiệp năm lần lặp lại với tỷ lệ 85% lần lặp lại tối đa) Cơng suất q trình đạp xe tăng dần lên mức trung bình 315 W với độ lệch tiêu chuẩn 16 W Xây Bài làm Gọi X cơng suất q trình đạp xe Theo đề bài, ta có: 𝑛 = (𝑛 < 30) 𝑥̅ = 315 s = 16 Gọi 𝜇 cơng suất trung bình q trình đạp xe Thống kê: 𝑇 = 𝑋̅ −𝜇 𝑆 √𝑛 ∼ 𝑇𝑛−1 (với 𝑛 = 7) Với độ tin cậy 95%, ta có: 𝛼 = 0.05 𝑛−1 7−1 ⇒ 𝑡1− 𝛼 = 𝑡 0.05 = 𝑡0.975 = 2.4469 1− 𝑛−1 Sai số ước lượng: 𝜖 = 𝑡1− 𝛼 × 𝑠 √𝑛 = 2.4469 × 16 √7 = 14.797 Khoảng tin cậy 95% cho trung bình 𝜇 là: 𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖 ⇔ 315 − 14.797 < 𝜇 < 315 + 14.797 ⇔ 300.203 < 𝜇 < 329.797 Vậy: Khoảng tin cậy 95% cho công suất trung bình trình đạp xe (300.203; 329.797) 𝑊 Dạng 2: Ước lượng tỉ lệ: Bài tập giáo trình: Từ 4.55 – 4.65 Bài tập thêm: An article in the Journal of the American Statistical Association (1990, Vol 85, pp 972– 985) measured the weight of 30 rats under experiment controls Suppose that 12 were underweight rats (a) Calculate a 95% two-sided confidence interval on the true proportion of rats that would show underweight from the experiment (b) Using the point estimate of p obtained from the preliminary sample, what sample size is needed to be 95% confident that the error in estimating the true value of p is less than 0.02? (c) How large must the sample be if you wish to be at least 95% confident that the error in estimating p is less than 0.02, regardless of the true value of p? (Một báo Tạp chí Hiệp hội Thống kê Hoa Kỳ (1990, Tập 85, trang 972–985) đo trọng lượng 30 chuột kiểm soát thí nghiệm Giả sử 12 chuột bị nhẹ cân (a) Tính khoảng tin cậy hai phía 95% tỷ lệ thực chuột có biểu nhẹ cân từ thí nghiệm (b) Sử dụng ước lượng điểm p thu từ mẫu ban đầu, cỡ mẫu cần thiết để có độ tin cậy 95% sai số ước lượng giá trị thực p nhỏ 0,02? (c) Mẫu phải lớn muốn chắn 95% sai số ước lượng p nhỏ 0,02, giá trị thực p bao nhiêu?) Bài làm a) Gọi Y chuột bị nhẹ cân (Đơn vị: con) 𝑝 tỉ lệ chuột bị nhẹ cân 𝑝̂ tỉ lệ chuột bị nhẹ cân thí nghiệm Theo đề bài, ta có: 𝑦 12 𝑦 = 12 } ⇒ 𝑝̂ = = = 0.4 𝑛 30 𝑛 = 30 𝑛𝑝̂ = 30 × 0.4 = 12 > Kiểm tra điều kiện: { 𝑛(1 − 𝑝̂ ) = 30 × (1 − 0.4) = 18 > Thống kê: 𝑍 = 𝑃̂ −𝑃 ̂ ̂ √𝑃(1−𝑃) ∼ 𝑁(0,1) 𝑛 Với độ tin cậy 95%, ta có: 𝛼 = 0.05 ⇒ 𝑧1−𝛼 = 𝑧 1− 0.05 = 𝑧0.975 = 1.96 𝑝̂(1−𝑝̂) Sai số ước lượng: 𝜖 = 𝑧1−𝛼 × √ 𝑛 0.4×(1−0.4) = 1.96 × √ 30 = 0.1753 Khoảng tin cậy 95% cho tỉ lệ 𝑝 là: 𝑝̂ − 𝜖 < 𝑝 < 𝑝̂ + 𝜖 ⇔ 0.4 − 0.1753 < 𝑝 < 0.4 + 0.1753 ⇔ 0.2247 < 𝑝 < 0.5753 Vậy: Với khoảng tin cậy 95%, tỉ lệ chuột có biểu nhẹ cân thuộc khoảng (0.2247; 0.5753) b) Với độ tin cậy 95% 𝑝̂ = 0.4, sai số ước lượng nhỏ 0.02 nghĩa là: 𝜖 < 0.02 ⇔ 𝑧0.975 × √ ⇔ 1.96 × √ 𝑝̂ (1 − 𝑝̂ ) < 0.02 𝑛 0.4 × (1 − 0.4) < 0.02 𝑛 ⇔ 𝑛 > 2304.96 Vậy: Để sai số ước lượng nhỏ 0.02 với độ tin cậy 95%, 𝑝̂ = 0.4 cần khảo sát 2305 chuột c) Vì 𝑝̂ chưa biết, 𝑝̂ (1 − 𝑝̂ ) đạt giá trị cực đại 𝑝̂ = − 𝑝̂ ⇒ 𝑝̂ = 0.5 ⇔ 𝑝̂ (1 − 𝑝̂ ) = 0.25 Sai số ước lượng nhỏ 0.02 với độ tin cậy 95% với 𝑝̂ nghĩa là: 1.96 × √ 0.25 < 0.02 𝑛 ⇔ 𝑛 > 2401 Vậy: Để sai số ước lượng nhỏ 0.02 với độ tin cậy 95% với giá trị thực p phải khảo sát 2402 chuột The Arizona Department of Transportation wishes to survey state residents to determine what proportion of the population would like to increase statewide highway speed limits from 65 mph to 75 mph How many residents does the department need to survey if it wants to be at least 99% confident that the sample proportion is within 0.05 of the true proportion? (Bộ Giao thông vận tải Arizona muốn khảo sát cư dân tiểu bang để xác định tỷ lệ dân số muốn tăng giới hạn tốc độ đường cao tốc toàn tiểu bang từ 65 dặm lên 75 dặm Bộ cần khảo sát cư dân muốn chắn 99% tỷ lệ dân số muốn tăng giới hạn tốc độ 0.05?) Bài làm Gọi Y số dân bang Arizona muốn tăng giới hạn tốc độ đường cao tốc toàn tiểu bang từ 65 dặm lên 75 dặm Với độ tin cậy 99%, ta có: 𝛼 = 0.01 ⇒ 𝑧1−𝛼 = 𝑧1−0.01 = 𝑧0.995 = 2.575 2 Vì 𝑝̂ chưa biết, 𝑝̂ (1 − 𝑝̂ ) đạt giá trị cực đại 𝑝̂ = − 𝑝̂ ⇒ 𝑝̂ = 0.5 ⇔ 𝑝̂ (1 − 𝑝̂ ) = 0.25 Nếu muốn chắn 99% tỉ lệ dân số muốn tăng giới hạn tốc độ 0.05 nghĩa là: 𝜖 = 0.05 ⇔ 𝑧0.995 × √ 𝑝̂ (1 − 𝑝̂ ) = 0.05 𝑛 ⇔ 2.575 × √ 0.25 = 0.05 𝑛 ⇔ 𝑛 = 663.0625 Vậy: Cần khảo sát 664 người muốn chắn 99% tỉ lệ tỉ lệ dân số muốn tăng giới hạn tốc độ 0.05 A study is to be conducted of the percentage of homeowners who own at least two television sets How large a sample is required if we wish to be 99% confident that the error in estimating this quantity is less than 0.017? (Một nghiên cứu tỷ lệ phần trăm chủ nhà sở hữu hai ti vi Cỡ mẫu muốn chắn 99% lỗi ước tính đại lượng nhỏ 0,017?) Gọi Y số lượng nhà có ti vi Với độ tin cậy 99%, ta có: 𝛼 = 0.01 ⇒ 𝑧1−𝛼 = 𝑧1−0.01 = 𝑧0.995 = 2.575 2 Vì Vì 𝑝̂ chưa biết, 𝑝̂ (1 − 𝑝̂ ) đạt giá trị cực đại 𝑝̂ = − 𝑝̂ ⇒ 𝑝̂ = 0.5 ⇔ 𝑝̂ (1 − 𝑝̂ ) = 0.25 Nếu muốn chắn tỉ 99% tỉ lệ lỗi nhỏ 0.01 nghĩa là: 𝜖 = 0.01 ⇔ 𝑧0.995 × √ 𝑝̂ (1 − 𝑝̂ ) = 0.01 𝑛 ⇔ 2.575 × √ 0.25 = 0.01 𝑛 ⇔ 𝑛 = 128.75 Vậy: Cỡ mẫu cần 129 muốn chắn 99% lỗi ước tính đại lượng nhỏ 0.01 Dạng 3: Kiểm định mẫu: So sánh trung bình với số Bài tập giáo trình: Từ 5.19 – 5.62 Bài tập thêm: Medical researchers have developed a new artificial heart constructed primarily of titanium and plastic The heart will last and operate almost indefinitely once it is implanted in the patient’s body, but the battery pack needs to be recharged about every four hours A random sample of 50 battery packs is selected and subjected to a life test The average life of these batteries is 4.05 hours Assume that battery life is normally distributed with standard deviation 𝜎 = 0.2 hour (a) Is there evidence to support the claim that mean battery life exceeds hours? Use 𝛼 = 0.05 (b) What is the P-value for the test in part (a)? (Các nhà nghiên cứu y học phát triển trái tim nhân tạo cấu tạo chủ yếu titan nhựa Trái tim tồn hoạt động gần vơ thời hạn sau cấy vào thể bệnh nhân, pin cần sạc lại khoảng bốn lần Một mẫu ngẫu nhiên gồm 50 pin chọn trải qua kiểm tra tuổi thọ Tuổi thọ trung bình viên pin 4,05 Giả sử thời lượng pin có phân phối chuẩn với độ lệch chuẩn σ = 0,2 (a) Có chứng chứng minh cho tuyên bố thời lượng pin có nghĩa vượt không? Sử dụng α = 0,05 (b) Giá trị 𝑃𝑔𝑖á 𝑡𝑟ị cho phép thử phần (a) bao nhiêu?) Bài làm a) Gọi X thời lượng pin trái tim nhân tạo Theo đề bài, ta có: 𝑋 ∼ 𝑁(𝜇, 𝜎 ) 𝑛 = 50 (𝑛 > 30) 𝑥̅ = 4.05 𝜎 = 0.2 Gọi 𝜇 thời lượng pin trung bình trái tim nhân tạo Giả thuyết: { 𝐻0 : 𝜇 = 𝜇0 = 𝐻1 : 𝜇 > 𝜇0 Khi 𝐻0 ta có thống kê 𝑍 = 𝑋̅ −𝜇 𝜎 √𝑛 ∼ 𝑁(0,1) Với mẫu thực nghiệm, ta tính giá trị thống kê: 𝑧 = 𝑥̅ −𝜇 𝜎 √𝑛 = 4.05−4 0.2 √50 = 5√2 = 1.77 Với mức ý nghĩa 𝛼 = 5%, tra bảng phân phối Gauss, ta có: 𝑧1−𝛼 = 𝑧1−0.05 = 𝑧0.95 = 1.645 Ta thấy: 𝑧 = 1.77 > 𝑧1−𝛼 = 1.645 Do ta có đủ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 5% Vậy: Thời lượng pin trung bình khơng vượt q b) 𝑝𝑔𝑖á 𝑡𝑟ị = − 𝜙(𝑧) = − 𝜙(1.77) = − 0.9616 = 0.0384 Humans are known to have a mean gestation period of 280 days (from last menstruation) with a standard deviation of about days A hospital wondered whether there was any evidence that their patients were at risk for giving birth prematurely In a random sample of 70 women, the average gestation time was 274.3 days (a) Is the alternative hypothesis one- or two-sided? (b) Test the null hypothesis at 𝛼 = 0.05 (c) What is the P-value of the test statistic? (Phụ nữ biết có thời gian mang thai trung bình 280 ngày (kể từ lần hành kinh cuối cùng) với độ lệch chuẩn khoảng ngày Một bệnh viện tự hỏi liệu có chứng cho thấy bệnh nhân họ có nguy sinh non hay không Trong mẫu ngẫu nhiên gồm 70 phụ nữ, thời gian mang thai trung bình 274,3 ngày (a) Giả thuyết thay hay hai phía? (b) Kiểm định giả thuyết rỗng α = 0,05 (c) Giá trị 𝑃𝑔𝑖á 𝑡𝑟ị thống kê thử nghiệm bao nhiêu?) Bài làm Gọi X thời gian phụ nữ mang thai Theo đề bài, ta có: 𝑛 = 70 (𝑛 > 30) 𝑥̅ = 274.3 𝜎=9 Gọi 𝜇 thời gian trung bình phụ nữ mang thai a) Đây kiểm định hai phía b) Giả thuyết: { 𝐻0 : 𝜇 = 𝜇0 = 280 𝐻1 : 𝜇 ≠ 𝜇0 Khi 𝐻0 ta có thống kê 𝑍 = 𝑋̅ −𝜇 𝜎 √𝑛 ∼ 𝑁(0,1) Với mẫu thực nghiệm, ta có giá trị thống kê 𝑧 = 𝑥̅ −𝜇 𝜎 √𝑛 = 274.3−280 √70 =− 19√70 30 ≈ −5.30 Với mức ý nghĩa 𝛼 = 0.05, tra bảng phân phối Gauss, ta có: 𝑧1−𝛼 = 𝑧1−0.05 = 𝑧0.975 = 1.96 2 Ta thấy: |𝑧| = 5.3 > 𝑧1−𝛼 = 1.96 Do đó: Ta có đủ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05 Vậy: Thời gian mang thai trung bình phụ nữ khác 280 ngày c) 𝑝𝑔𝑖á 𝑡𝑟ị = − 2𝜙(|𝑧|) = − 2𝜙(|−5.30|) = − × = −1 The bacterial strain Acinetobacter has been tested for its adhesion properties A sample of five measurements gave readings of 2.69, 5.76, 2.67, 1.62 and 4.12 dyne-cm2 Assume that the standard deviation is known to be 0.66 dyne-cm2 and that the scientists are interested in high adhesion (at least 2.5 dyne-cm2) (a) Should the alternative hypothesis be one-sided or two-sided? (b) Test the hypothesis that the mean adhesion is 2.5 dyne-cm2 (c) What is the P-value of the test statistic? (Chủng vi khuẩn Acinetobacter thử nghiệm đặc tính bám dính Một mẫu gồm năm phép đo cho kết 2,69, 5,76, 2,67, 1,62 4,12 dyn/cm2 Giả sử độ lệch chuẩn biết 0,66 dyn/cm2 nhà khoa học quan tâm đến độ kết dính cao (ít 2,5 dyn/cm2) (a) Giả thuyết thay phía hay hai phía? (b) Kiểm tra giả thuyết độ kết dính trung bình 2,5 dyne-cm2 (c) Giá trị 𝑃𝑔𝑖á 𝑡𝑟ị thống kê thử nghiệm bao nhiêu?) Bài làm Gọi X độ kết dính chủng vi khuẩn Acinetobacter Giả sử 𝑋 ∼ 𝑁(𝜇, 𝜎 ) Dựa vào số liệu đề bài, ta tính 𝑛 = (𝑛 < 30) 𝜎 = 0.66 𝑥̅ = 3.372 Gọi 𝜇 độ kết dính trung bình chủng vi khuẩn Acinetobacter a) Kiểm định kiểm định phía bên trái b) Giả thuyết: { 𝐻0 : 𝜇 = 𝜇0 = 2.5 𝐻1 : 𝜇 < 𝜇0 Khi 𝐻0 ta có thống kê 𝑍 = 𝑋̅ −𝜇 𝜎 √𝑛 ∼ 𝑁(0,1) Với mẫu thực nghiệm, ta có giá trị thống kê 𝑧 = 𝑥̅ −𝜇 𝜎 √𝑛 = 3.372−2.5 0.66 √5 ≈ 2.95 Với mức ý nghĩa 𝛼 = 0.05, tra bảng phân phối Gauss, ta có: 𝑧1−𝛼 = 𝑧1−0.05 = 𝑧0.95 = 1.645 Ta thấy: −𝑧1−𝛼 = −1.645 < 𝑧 = 2.95 Do ta khơng có đủ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05 Vậy: Độ kết dính trung bình chủng vi khuẩn Acinetobacter có giá trị 2.5 𝑑𝑦𝑛/𝑐𝑚2 c) 𝑝𝑔𝑖á 𝑡𝑟ị = 𝜙(𝑧) = 𝜙(2.95) = 0.9984 Cloud seeding has been studied for many decades as a weather modification procedure (for an interesting study of this subject, see the article in Technometrics, “A Bayesian Analysis of a Multiplicative Treatment Effect in Weather Modification,” Vol 17, pp 161–166) The rainfall in acre-feet from 20 clouds that were selected at random and seeded with silver nitrate follows: 18.0, 30.7, 19.8, 27.1, 22.3, 18.8, 31.8, 23.4, 21.2, 27.9, 31.9, 27.1, 25.0, 24.7, 26.9, 21.8, 29.2, 34.8, 26.7, and 31.6 Can you support a claim that mean rainfall from seeded clouds exceeds 25 acre-feet? Use 𝛼 = 0.01 Find the P-value (Việc gieo hạt vào đám mây nghiên cứu nhiều thập kỷ quy trình điều chỉnh thời tiết (để có nghiên cứu thú vị chủ đề này, xem báo tạp chí Technometrics, “A Bayesian Analysis of a Multiplicative Treatment Effect in Weather Modification,”, Tập 17, trang 161– 166) Lượng mưa tính mẫu Anh từ 20 đám mây chọn ngẫu nhiên gieo bạc nitrat sau: 18,0, 30,7, 19,8, 27,1, 22,3, 18,8, 31,8, 23,4, 21,2, 27,9, 31,9, 27,1, 25,0, 24,7, 26,9, 21,8, 29,2, 34,8, 26,7 31,6 Có thể ủng hộ tuyên bố lượng mưa từ đám mây có hạt vượt q 25 mẫu Anh khơng? Sử dụng α = 0,01 Tìm giá trị P Bài làm Gọi X lượng mưa từ đám mây Dựa vào kiện đề bài, ta có: 𝑛 = 20 (𝑛 < 30) 𝑥̅ = 26.035 𝑠 = 4.78 𝜎 chưa biết Gọi 𝜇 lượng mưa trung bình từ đám mây Giả thuyết: { 𝐻0 : 𝜇 = 𝜇0 = 25 𝐻1 : 𝜇 > 𝜇0 Khi 𝐻0 ta có kê 𝑇 = 𝑋̅ −𝜇 𝑆 √𝑛 ∼ 𝑇𝑛−1 với 𝑛 = 20 Với mẫu thực nghiệm, ta tính giá trị thống kê 𝑡 = 𝑥̅ −𝜇 𝑠 √𝑛 = 26.035−25 4.78 √20 ≈ 0.968 𝑛−1 20−1 19 Với mức ý nghĩa 𝛼 = 0.01, tra bảng phân phối Student: 𝑡1−𝛼 =1−0.01 = 𝑡0.99 = 2.5395 𝑛−1 Ta thấy: 𝑡 = 0.968 < 𝑡1−𝛼 = 2.5395 Do đó: khơng đủ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.01 Vậy: Lượng mưa trung bình từ đám mây không vượt 25 mẫu Anh 5 An article in the ASCE Journal of Energy Engineering (1999, Vol 125, pp 59–75) describes a study of the thermal inertia properties of autoclaved aerated concrete used as a building material Five samples of the material were tested in a structure, and the average interior temperatures (°C) reported were as follows: 23.01, 22.22, 22.04, 22.62, and 22.59 Test the hypotheses 𝐻0 : 𝜇 = 22.5 versus 𝐻1 : 𝜇 ≠ 22.5, using 𝛼 = 0.05 Find the P-value (Một báo Tạp chí ASCE Journal of Energy Engineering (1999, Tập 125, trang 59– 75) mô tả nghiên cứu đặc tính qn tính nhiệt bê tơng khí chưng áp sử dụng làm vật liệu xây dựng Năm mẫu vật liệu thử nghiệm cấu trúc nhiệt độ bên trung bình (° C) báo cáo sau: 23,01, 22,22, 22,04, 22,62 22,59 Kiểm định giả thuyết 𝐻0 : 𝜇 = 22,5 so với 𝐻1 : 𝜇 ≠ 22,5, sử dụng α = 0,05 Tìm giá trị 𝑃𝑔𝑖á 𝑡𝑟ị?) Bài làm Gọi X nhiệt độ bê tơng khí chưng áp sử dụng làm vật liệu xây dựng Theo đề bài, ta có: 𝑛 = (𝑛 < 30) 𝑥̅ = 22.496 𝑠 = 0.378 𝜎 chưa biết Gọi 𝜇 nhiệt độ trung bình bê tơng chưng áp sử dụng làm vật liệu xây dựng Giả thuyết: { 𝐻0 : 𝜇 = 𝜇0 = 22.5 𝐻1 : 𝜇 ≠ 𝜇0 Khi 𝐻0 ta có thống kê 𝑇 = 𝑋̅ −𝜇 𝑆 √𝑛 ∼ 𝑇𝑛−1 với 𝑛 = Với mẫu thực nghiệm, ta tính giá trị thống kê 𝑡 = 𝑥̅ −𝜇 𝑠 √𝑛 = 22.496−22.5 0.378 √5 ≈ −0.024 𝑛−1 5−1 Với mức ý nghĩa 𝛼 = 0.05, tra bảng phân phối Student: 𝑡1− 𝛼 = 0.05 = 𝑡0.975 = 2.7764 1− 2 𝑛−1 Ta thấy: |𝑡| = 0.024 < 𝑡1− 𝛼 = 2.7764 Do đó: khơng đủ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05 Vậy: Giả thuyết 𝐻0 𝑝𝑔𝑖á 𝑡𝑟ị = 2𝑃(𝑡𝑛−1 > |𝑡|) = 2𝑃(𝑡4 > 0.024) ≈ × (1 − 0.6) ≈ 0.8 Dạng 4: Kiểm định mẫu: So sánh trung bình với tỉ lệ: Bài tập giáo trình: Từ 5.69 – 5.88 Bài tập thêm: The advertised claim for batteries for cell phones is set at 48 operating hours with proper charging procedures A study of 5000 batteries is carried out and 15 stop operating prior to 48 hours Do these experimental results support the claim that less than 0.2 percent of the company’s batteries will fail during the advertised time period, with proper charging procedures? Use a hypothesis-testing procedure with 𝛼 = 0.01 (Có quảng cáo cho pin dành cho điện thoại di động có 48 hoạt động với quy trình sạc thích hợp Một nghiên cứu 5000 pin thực 15 lần ngừng hoạt động trước 48 Các kết thử nghiệm có ủng hộ tun bố 0,2% pin công ty hỏng khoảng thời gian quảng cáo có thích hợp khơng? Sử dụng quy trình kiểm định giả thuyết với 𝛼 = 0.01.) Bài làm Gọi Y số điện thoại ngừng hoạt động trước 48 𝑝 tỉ lệ số điện thoại ngừng hoạt động trước 48 Theo đề bài, ta có: 𝑦 15 𝑦 = 15 } ⇒ 𝑝̂ = = = 0.003 𝑛 5000 𝑛 = 5000 𝑛𝑝̂ = 15 > Kiểm tra điều kiện: { 𝑛(1 − 𝑝̂ ) = 4985 > Giả thuyết: { 𝐻0 : 𝑝 = 𝑝0 = 0.002 𝐻1 : 𝑝 < 𝑝0 Khi 𝐻0 ta có thống kê 𝑍 = 𝑝̂−𝑝0 𝑝 (1−𝑝0 ) √ ∼ 𝑁(0,1) 𝑛 Với mẫu thực nghiệm, ta có giá trị thống kê: 𝑧 = 0.003−0.002 0.002(1−0.002) 5000 = 1.58 √ Với mức ý nghĩa 𝛼 = 0.01, tra bảng phân phối Gauss, ta có: 𝑧1−𝛼 = 𝑧1−0.01 = 𝑧0.99 = 2.33 Ta thấy: 𝑧 = 1.58 > −𝑧1−𝛼 = −2.33 Do đó: Khơng có đủ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.01 Vậy: Có 0.2% pin công ti hỏng khoảng thời gian 48 với mức ý nghĩa 𝛼 = 0.01 A computer manufacturer ships laptop computers with the batteries fully charged so that customers can begin to use their purchases right out of the box In its last model, 85% of customers received fully charged batteries To simulate arrivals, the company shipped 100 new model laptops to various company sites around the country Of the 100 laptops shipped, 95 of them arrived reading 100% charged Do the data provide evidence that this model’s rate is at least as high as the previous model? Test the hypothesis at 𝛼 = 0.05 (Một nhà sản xuất máy tính vận chuyển máy tính xách tay sạc đầy pin để khách hàng bắt đầu sử dụng mua hàng họ Trong mơ hình cuối nó, 85% khách hàng nhận pin sạc đầy Để mô lượng khách đến, công ty vận chuyển 100 máy tính xách tay mẫu đến địa điểm công ty khác khắp đất nước Trong số 100 máy tính xách tay xuất xưởng, 95 máy tính số sạc đầy Dữ liệu có cung cấp chứng tỷ lệ mơ hình cao mơ hình trước khơng? Kiểm định giả thuyết α = 0,05) Bài làm Gọi Y số máy tính sạc đầy 𝑝 tỉ lệ số máy tính sạc đầy Theo đề bài, ta có: 𝑦 95 𝑦 = 95 } ⇒ 𝑝̂ = = = 0.95 𝑛 100 𝑛 = 100 𝑛𝑝̂ = 95 > Kiểm tra điều kiện: { 𝑛(1 − 𝑝̂ ) = = Giả thuyết: { 𝐻0 : 𝑝 = 𝑝0 = 0.85 𝐻1 : 𝑝 < 𝑝0 Khi 𝐻0 ta có thống kê 𝑍 = 𝑝̂−𝑝0 𝑝 (1−𝑝0 ) √ 𝑛 ∼ 𝑁(0,1) Với mẫu thực nghiệm, ta có giá trị thống kê: 𝑧 = 0.95−0.85 0.85(1−0.85) 100 = 2.8 √ Với mức ý nghĩa 𝛼 = 0.05, tra bảng phân phối Gauss, ta có: 𝑧1−𝛼 = 𝑧1−0.05 = 𝑧0.95 = 1.645 Ta thấy: 𝑧 = 2.8 > −𝑧1−𝛼 = −1.645 Do đó: Khơng có đủ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05 Vậy: Tỉ lệ mơ hình cao mơ hình trước với mức ý nghĩa 5% In a random sample of 500 handwritten zip code digits, 466 were read correctly by an optical character recognition (OCR) system operated by the U.S Postal Service (USPS) USPS would like to know whether the rate is at least 90% correct Do the data provide evidence that the rate is at least 90% at 𝛼 = 0.05? (Trong mẫu ngẫu nhiên gồm 500 mã zip viết tay chữ số, 466 đọc xác hệ thống nhận dạng ký tự quang học (OCR) Bưu điện Hoa Kỳ vận hành (USPS) USPS muốn biết liệu tỷ giá có mức 90% Dữ liệu có cung cấp chứng tỷ lệ 90% α = 0,05?) Bài làm Gọi Y số mã zip đọc xác hệ thống nhận dạng kí tự quang học 𝑝 tỉ lệ số mã zip đọc xác hệ thống nhận dạng kí tự quang học Theo đề bài, ta có: 𝑦 466 𝑦 = 466 } ⇒ 𝑝̂ = = = 0.932 𝑛 500 𝑛 = 500 𝑛𝑝̂ = 466 > Kiểm tra điều kiện: { 𝑛(1 − 𝑝̂ ) = 34 = Giả thuyết: { 𝐻0 : 𝑝 = 𝑝0 = 0.9 𝐻1 : 𝑝 < 𝑝0 Khi 𝐻0 ta có thống kê 𝑍 = 𝑝̂−𝑝0 𝑝 (1−𝑝0 ) √ ∼ 𝑁(0,1) 𝑛 Với mẫu thực nghiệm, ta có giá trị thống kê: 𝑧 = 0.932−0.9 0.9(1−0.9) 500 = 2.385 √ Với mức ý nghĩa 𝛼 = 0.05, tra bảng phân phối Gauss, ta có: 𝑧1−𝛼 = 𝑧1−0.05 = 𝑧0.95 = 1.645 Ta thấy: 𝑧 = 2.385 > −𝑧1−𝛼 = −1.645 Do đó: Khơng có đủ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05 Vậy: tỉ lệ số mã zip đọc xác hệ thống nhận dạng kí tự quang học 90% với mức ý nghĩa 𝛼 = 0.05 Dạng 5: Kiểm định hai mẫu: So sánh hai trung bình Bài tập giáo trình: Từ 5.89 – 5.125 Bài tập thêm: An article in Quality Engineering [2012, Vol 24(1)] described an experiment on a grinding wheel The following are some of the grinding force data (in N) from this experiment at two different vibration levels Low 242, 249, 235, 250, 254, 244, 258, 311, 237, 261, 314, 252 High 302, 421, 419, 399, 317, 311, 350, 363, 392, 367, 301, 302 Is there evidence to support the claim that the mean grinding force increases with the vibration level? (Một báo Kỹ thuật chất lượng [2012, Vol 24 (1)] mơ tả thí nghiệm bánh mài Sau số liệu lực mài (tính N) từ thí nghiệm hai mức độ rung khác Thấp 242, 249, 235, 250, 254, 244, 258, 311, 237, 261, 314, 252 Cao 302, 421, 419, 399, 317, 311, 350, 363, 392, 367, 301, 302 Có chứng chứng minh cho tuyên bố lực mài trung bình tăng theo mức độ rung khơng?) Bài làm Gọi X Y lực trung bình độ rung thấp cao bánh mài Theo đề bài, ta có: 𝑛𝑋 = 𝑛𝑌 = 12 (𝑛𝑋 = 𝑛𝑌 < 30) 𝑥𝑋 = 258.92 ̅̅̅ 𝑥𝑌 = 353.67 ̅̅̅ 𝑠𝑋 = 26.22 𝑠𝑌 = 46.5956 𝜎𝑋 𝜎𝑌 chưa biết Giả sử 𝜎𝑋2 = 𝜎𝑌2 = 𝜎 X, Y tuân theo phân phối chuẩn Gọi 𝜇𝑋 𝜇𝑌 độ lớn trung bình lực mài thấp lực mài cao 𝜇𝑋 = 𝜇𝑌 Giả thuyết: {𝜇 < 𝜇 𝑋 𝑌 Khi 𝐻0 ta có thống kê 𝑇 = ̅̅̅̅ ̅̅̅̅ 𝑋𝑋 −𝑋 𝑌 1 + ) 𝑛𝑋 𝑛𝑌 √𝑆 ( ∼ 𝑇𝑛𝑋+𝑛𝑌−2 (𝑛𝑋 −1)𝑆𝑋 +(𝑛𝑌 −1)𝑆𝑌2 Với 𝑆 = 𝑛𝑋 +𝑛𝑌 −2 Với mẫu thực nghiệm, ta tính được: (𝑛𝑋 − 1)𝑠𝑋2 + (𝑛𝑌 − 1)𝑠𝑌2 (12 − 1) × 26.222 + (12 − 1) × 46.59562 𝑠 = = = 1429.32 𝑛𝑋 + 𝑛𝑌 − 12 + 12 − 2 ⇒ 𝑠 = √1429.32 = 37.8 𝑥𝑋 − ̅̅̅ ̅̅̅ 𝑥𝑌 𝑡= 1 𝑛𝑋 + 𝑛𝑌 ) √𝑠 ( = 258.92 − 353.67 √37.8 × ( + ) 12 12 = −37.75 Với mức ý nghĩa 𝛼 = 0.05, tra bảng phân phối Student, ta có: 𝑛 +𝑛𝑌 −2 𝑋 𝑡1−𝛼 12+12−2 22 = 𝑡1−0.05 = 𝑡0.95 = 1.7171 𝑛 +𝑛𝑌 −2 𝑋 Ta thấy: 𝑡 = −37.75 < −𝑡1−𝛼 = −1.7171 Do đó: Có đủ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05 Vậy: Lực mài trung bình tăng theo mức độ rung với mức ý nghĩa 𝛼 = 0.05 A photoconductor film is manufactured at a nominal thickness of 25 mils The product engineer wishes to increase the mean speed of the film and believes that this can be achieved by reducing the thickness of the film to 20 mils Eight samples of each film thickness are manufactured in a pilot production process, and the film speed (in microjoules per square inch) is measured For the 25-mil film, the sample data result is ̅̅̅ 𝑥1 = 1.15 and 𝑠1 = 0.11, and for the 20-mil film the data yield 𝑥 ̅̅̅2 = 1.06 and 𝑠2 = 0.09 Note that an increase in film speed would lower the value of the observation in microjoules per square inch Do the data support the claim that reducing the film thickness increases the mean speed of the film? Use 𝜎 = 0.10, and assume that the two population variances are equal, and the underlying population of film speed is normally distributed What is the P-value for this test? (Màng quang dẫn sản xuất độ dày danh nghĩa 25 mil Kỹ sư sản phẩm mong muốn tăng tốc độ trung bình màng tin đạt điều cách giảm độ dày màng xuống 20 mil Tám mẫu độ dày màng sản xuất quy trình sản xuất thử nghiệm tốc độ màng (tính 𝜇𝐽/𝑖𝑛𝑐ℎ2 ) đo Đối với phim dày 25 mil, kết liệu mẫu ̅̅̅ 𝑥1 = 1.15 𝑠1 = 0,11, phim dày 20 mil, suất liệu 𝑥2 = 1,06 𝑠2 = 0,09 Lưu ý tốc độ phim tăng lên làm giảm giá trị quan sát ̅̅̅ tính 𝜇𝐽/𝑖𝑛𝑐ℎ2 Dữ liệu có ủng hộ tuyên bố việc giảm độ dày màng làm tăng tốc độ trung bình màng không? Sử dụng σ = 0,10 giả sử hai phương sai tổng thể tập hợp tốc độ phim phân phối bình thường Giá trị 𝑃𝑔𝑖á 𝑡𝑟ị cho phép thử bao nhiêu?) Bài làm Theo đề bài, ta có: 𝑛1 = 𝑛2 = 𝑥1 = 1.15 ̅̅̅ 𝑠1 = 0.11 𝑥2 = 1.06 ̅̅̅ 𝑠2 = 0.09 𝜎 = 0.1 Gọi 𝜇1 𝜇2 tốc độ trung bình màng quang dẫn 25 mil 20 mil 𝜇1 = 𝜇2 Giả thuyết: {𝜇 < 𝜇 Khi 𝐻0 ta có thống kê 𝑇 = ̅̅̅̅ ̅̅̅̅ 𝑋1 −𝑋 1 √𝑆 (𝑛 +𝑛 ) ∼ 𝑇𝑛1 +𝑛2−2 (𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆22 Với 𝑆 = 𝑛1 +𝑛2 −2 Với mẫu thực nghiệm ta có: (𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22 (8 − 1) × 0.112 + (8 − 1) × 0.092 𝑠 = = = 0.0101 𝑛1 + 𝑛2 − 8+8−2 ⇒ 𝑠 = √0.0101 = 0.1 𝑡= 𝑥1 − 𝑥 ̅̅̅ ̅̅̅2 1 + 𝑛1 𝑛2 ) √𝑠 ( = 1.15 − 1.06 √0.0101 × (1 + 1) 8 = 1.79

Ngày đăng: 15/09/2023, 11:27

w