Chương 6 Xử lý số liệu bao gồm các nội dung: - Mức độ tin cậy - Khoảng tin cậy (1 phía và 2 phía) - Độ chệch (BIas) - Kiểm định giả thuyết H0, H1 - Lỗi loại 1, lỗi loại 2 - Hàm nhị thức
Lê Bình Minh- 20172298 Bài tập chương – Xử lý số liệu thực nghiệm Phần 6.1 6.1 Nêu rõ số in đậm tham số hay thống kê a Một lơ hàng gồm 100 cầu chì có cầu chì bị lỗi Một mẫu gồm 25 cầu chì có cầu chì: tham số thống kê b Tốc độ 100 xe theo dõi Có 63 phương tiện vượt tốc độ quy định: 63 thống kê c Một thăm dò qua điện thoại cử tri đăng ký tuần trước bầu cử toàn tiểu bang cho thấy 48% bỏ phiếu cho thống đốc đương nhiệm thc, người tranh cử tái đắc cử Kết bầu cử cuối cho thấy người đương nhiệm giành chiến thắng với 52% số phiếu bầu: 48% thống kê, 52% tham số 6.2 Cho X1, X2, X3, X4 i.i.d quan sát từ phân phối với giá trị trung bình phương sai 2 Hãy xem xét bốn công cụ ước lượng sau a Chứng minh công thức không bias (chệch) Bias (𝜇̂ ) = E (𝜇̂ ) - 𝜃 = (X1) - = − = Bias (𝜇̂ ) = E (𝜇̂ ) - 𝜃 = E ( 𝑋2 +𝑋3 )-= 𝜇+𝜇 −𝜇= ias (𝜇̂ ) = E (𝜇̂ ) - 𝜃 = E (0,1X1 + 0,2X2 + 0,3X3 + 0,4X4) - 𝜃 = 0,1 + + + − = ias (𝜇̂ ) = E (𝜇̂ ) – 𝜃 = E (𝑋̅ ) - 𝜃 = 𝜇 − 𝜇 = Dựa vào giá trị Bias tính được, ta thấy cơng thức khơng có độ chệch b Tính phương sai công thức ước lượng, phương sai nhỏ Var (𝜇̂ ) = Var (X1) = 𝜎 𝑋2 + 𝑋3 Var (𝜇̂ ) = Var ( ) = 0,52 Var (X2) + 0,52 Var (X3) = 0,25 + = Var (𝜇̂ ) = Var (0,1X1 + 0,2X2 + 0,3X3 + 0,4X4) = + + + = 𝜎 Var (𝜇̂ ) = var (𝑋̅ ) = = 0,25 Giá trị Var (𝜇̂ ) nhỏ c 𝜇̂ = a1X1 + a2X2 + … + anXn; Var (𝜇̂ ) = (a12 + a22 + … + an2) 1 2 𝑛 𝜎2 𝑛 𝑛 𝑛 𝑛 𝑛 𝑛 Khi a1 = a2 = … = an = Var (𝜇̂ ) =[( ) + ( ) + ⋯ + ( ) ] 𝜎 = 𝜎2 = Ta thấy: Var (𝜇̂ )= Var (𝑋̅ ) nên 𝜇̂ = 𝑋̅ Trang 6.3 Cho X1, X2, …, Xn mẫu ngẫu nhiên từ phân phối U [0, ) Sử dụng kết Bài tập 5.44 để điều sau a Xmax ước lượng chệch Độ chệch bao nhiêu? Bias (Xmax) = E (Xmax) - = 𝑛𝜃 𝑛+1 −𝜃 = 𝜃( 𝑛 𝑛+1 − 1) = −1 𝑛+1 𝜃 b Xmin + Xmax ước lượng không chệch Từ suy khoảng giữa, định nghĩa (Xmin + Xmax)/2, ước lượng không chệch /2, giá trị trung bình phân phối U [0, ] Bias (Xmin + Xmax) = E (Xmin + Xmax) – 𝜃 = 𝜃 𝑛+1 + 𝑛𝜃 𝑛+1 −𝜃=0 6.4 Cho X1, X2 , Xn mẫu ngẫu nhiên từ phân phối có trung bình phương sai 2 Chứng tỏ (𝑋̅ )2 ước lượng chệch 2 Độ chệch gì? (Gợi ý: E ((𝑋̅ )2 - 2) = Var (𝑋̅ )= 2/n.) Bài giải: Ta có: E (𝑋̅ ) = ((𝑋̅ )) = Var (𝑋̅ ) + (E (𝑋̅ ))2 Var (𝑋̅ ) = E ((𝑋̅ )) − 𝜇2 E ((𝑋̅ )2) > 𝜇2 → E ((𝑋̅ )) ≠ 𝜇2 Vậy (𝑋̅ )2 ước lượng chệch 2 có độ chệch Bias ((𝑋̅ )2 ) = E ((𝑋̅ )2 ) - 𝜇2 = Var (𝑋̅ ) + 𝜇2 - 𝜇2 = Var (𝑋̅ ) = 𝜎2 𝑛 6.5 Giả sử có n thử nghiệm Bernoulli độc lập với xác suất thành công thực p Xem xét hai ước lượng p: 𝑝̂1 = 𝑝̂ 𝑝̂ Tỷ lệ mẫu thành cơng 𝑝̂ = 1/2 số cố định a Tìm giá trị kỳ vọng độ chệch công cụ ước lượng (𝑘ℎ𝑖 𝑥 = 1) 𝑝 Hàm Bernoulli: f (x) = P (X = x) = { − 𝑝 (𝑘ℎ𝑖 𝑥 = 0) 1 2 Giá trị kì vọng: E (𝑝̂1) = E (𝑝̂ ) = p; E (𝑝̂ ) = E ( ) = Độ chệch: Bias (𝑝̂1) = E (𝑝̂1) – p = p – p = 0, khơng có độ chệch Bias (𝑝̂ ) = E (𝑝̂2 ) – p = – p b Tìm phương sai công cụ ước lượng 1 𝑛 𝑛2 Var (𝑝̂1 ) = Var [ (X1 + X2 + … + Xn)] = = 𝑛2 (n (p – p2)) = [ Var (X1) + Var (X2) + … + Var (Xn)] 𝑝(1−𝑝) 𝑛 Var (𝑝̂2 ) = Var ( ) = Cơng cụ tính 𝑝̂ có phương sai thấp Cơng thức tính var phân bố Bernouli: Var (X) = E (X2) – [E (X)]2 = p(1-p) c Tính MSE cơng cụ ước lượng (MSE: Mean square error) MSE (𝑝̂1 ) = Var (𝑝̂1) + [Bias (𝑝̂1 )]2 = 𝑝(1−𝑝) 𝑛 = 𝑝−𝑝2 𝑛 Trang MSE (𝑝̂ ) = Var (𝑝̂2 ) + [Bias (𝑝̂2 )]2 = ( − 𝑝) 2 Vẽ đồ thị MSE so với p với n = MSE (𝑝̂1 ) = 𝑝−𝑝2 Đồ thị MSE (𝑝̂1 ) = 𝑝−𝑝2 Đồ thị MSE (𝑝̂ ) = ( − 𝑝) 2 1 Nhận xét đồ thị: Đồ thị MSE (𝑝̂1) có dạng parabol hình qua điểm (0,0), ( , ), 16 1 4 (1,0) Đồ thị MSE (𝑝̂2 ) có dạng parabol qua điểm (0, ), ( , 0), (1, ) Vì vậy: 𝑝̂1 nhìn chung đường cong phẳng đồng nghĩa với rủi ro Tuy nhiên 𝑝̂2 có MSE thấp với p gần 0,5 𝑝̂1 khơng phải lúc công cụ tốt 6.6 Biểu thị 𝜃̂1 𝜃̂2 ước lượng độc lập không chệch 𝜃 Giả sử Var (𝜃̂1 ) = 𝜎12 , Var (𝜃̂2 ) = 𝜎22 Hãy xem xét công cụ ước lượng tổng hợp 𝜃̂ = 𝜔1 𝜃̂1 + 𝜔2 𝜃̂2 , 𝜔1 𝜔2 cố định trọng lượng a Chứng minh 𝜃̂ không chệch 1 + 2 = có 1 + 2 = nên 2 = - 1 Bias (𝜃̂) = E (𝜃̂) – 𝜃 = E (𝜔1 𝜃̂1 + 𝜔2 𝜃̂2 ) – 𝜃 = 𝜔1 𝐸(𝜃̂1 ) + (1 − 𝜔1 )𝐸(𝜃̂2 ) − 𝜃 = 𝜔1 𝜃 + (1 − 𝜔1 )𝜃 − 𝜃 = Vậy 𝜃̂ không chệch 1 + 2 = b Chứng tỏ Var (𝜃̂) = 𝜔12 𝜎12 + 𝜔22 𝜎22 cực tiểu 𝜔1 = Var (𝜃̂) = 𝜔12 𝜎12 + 𝜔22 𝜎22 = ( = 𝜎22 𝜎1 +𝜎22 𝜎22 𝜎12 +𝜎22 ; 𝜔2 = − 𝜔1 = ) ⋅ 𝜎12 +( 𝜎12 𝜎12 +𝜎22 𝜎12 𝜎1 +𝜎22 ) ⋅ 𝜎22 = 𝜎24 ⋅𝜎12 +𝜎12 ⋅𝜎24 (𝜎12 +𝜎22 ) = 𝜎12 𝜎22 (𝜎12 +𝜎22 ) (𝜎12 +𝜎22 ) 𝜎12 𝜎22 𝜎12 +𝜎22 6.7 Một mẫu ngẫu nhiên gồm 10 lon cà phê lấy từ dây chuyền sản xuất cân thành phần bên Các trọng số (tính oz.) Như sau Trang Tính giá trị trung bình mẫu ước tính giá trị trung bình trình sai số chuẩn trung bình (SEM) Bài giải: Giá trị trung bình mẫu: 𝑋̅ = Giá trị phương sai mẫu: s2 = 𝑛−1 10 (𝑥1 + 𝑥2 + ⋯ + 𝑥10 ) = 26,15 (oz) ∑𝑥(𝑥𝑖 − 𝑥̅ )2 = 0,2316 = 𝜎 𝜎2 Sai số chuẩn chung bình: SEM = √ 𝑛 = 0,152 6.8 Vào đầu quyền tổng thống Bill Clinton, ơng đề xuất cải cách sinh thái đề xuất Một mẫu người nghe phát biểu (n = 611) hỏi liệu họ có ủng hộ thuế cao tất dạng lượng hay khơng 43% trả lời Có "Coi tỷ lệ phần trăm phổ biến ước tính phần trăm dân số (dân số bao nhiêu?), Hãy tính sai số chuẩn Bài giải: Số người đồng ý: x = 611 x 43% = 262.73 ~ 263 𝑝̂(1−𝑝̂) Sai số chuẩn mẫu là: SE (𝑝̂ ) = √ 𝑛 0,43(1−0,43) =√ 611 = 0,0200 6.9 Tìm phương pháp ước lượng mômen tham số gamma với hàm mật độ xác suất phân bố dựa mẫu ngẫu nhiên X1, X2, , Xn Cân giá trị trung bình phương sai phân bố gamma, cho đại lượng mẫu tương ứng ˆ ˆ − ˆ1 tương ứng 𝜃 Bài giải: Hàm phân bố Gamma f (x) = 𝜃1 ⋅𝑥 𝜃2 −1 ⋅ⅇ −𝜃1 𝑥 𝛤(𝜃2 ) Có E (X) = 𝑋̅ = 𝜇̂ Var (X) = s = 𝜇̂ − 𝜇̂ (theo đề cho) 2 Theo hàm f (x), có E(X) = 𝜃2 𝜃1 Var (X) = = 𝜇̂ ; từ 𝜃2 = 𝜇̂ ⋅ 𝜃1 (1) 𝜃2 𝜃12 = 𝜇̂ − 𝜇̂ ; từ đó: 𝜃2 = (𝜇̂ − 𝜇̂ )𝜃1 = 𝜎 ⋅ 𝜃1 (2) Chia (1) (2) theo vế: = (𝜇 ̂ 𝜇 ̂ −𝜇 ̂ )𝜃1 Thay (3) vào (2) ta được: 𝜃2 = = ̂ 𝜇 𝜎2 ⋅𝜃1 → 𝜃1 = ̂ 𝜇 𝜎2 (3) ̂2 𝜇 𝜎2 6.10 Tìm phương pháp ước lượng mơ men tham số 1 2 phân phối beta với hàm mật độ xác suất dựa mẫu ngẫu nhiên X1, X2, , Xn Cân giá trị trung bình phương sai phân bố gamma, cho đại lượng mẫu tương ứng ˆ ˆ − ˆ1 tương ứng Trang 𝛤(𝜃1 +𝜃2 ) Bài giải: Hàm phân bố Beta: f (x) = 𝛤(𝜃1 )𝛤(𝜃2 ) 𝑥 𝜃1 −1 (1 − 𝑥)𝜃2 −1 Có E (X) = 𝑋̅ = 𝜇̂ Var (X) = s2 = 𝜇̂ − 𝜇̂ (theo đề cho) Theo hàm f (x), có E(X) = 𝜃1 𝜃1 +𝜃2 Var (X) = (𝜃 = 𝜇̂ 𝜃1 𝜃2 +𝜃2 ) (𝜃1 +𝜃2 +1) = s2 Phần 6.2 6.11 Xem xét xác suất sau: Trong X giá trị trung bình tập hợp ngẫu nhiên có kích thước n rút từ phân phối N (,2) a Tìm khoảng tin cậy 𝜇, mức độ tin cậy khoảng Ta có 𝑍 = 𝑋̅ −𝜇 𝜎/ √𝑛 phân bố chuẩn tắc X P (-1,645 ≤ Z ≤ 1,645) = 0,95 – 0,05 = 0,90 Mức độ tin cậy 90% khoảng tin cậy là: 𝜎 𝜎 [𝑥̅ − 1,645 , 𝑥̅ + 1,645 ] √𝑛 √𝑛 b Mẫu có n = 100, lấy từ quần thể có = , giá trị trung bình mẫu 30, tính khoảng tin cậy 90% CI = [30 − 1,645 ⋅ 10 √100 , 30 + 1,645 ⋅ 10 √100 ] = [28,355; 31,645] c Mặc dù P (𝑥̅ - 1,645 ≤ Z ≤ 𝑥̅ + 1,645) = 0,90 xác suất P (28,355 ≤ 𝜇 ≤ 31,645) là 0,90 6.12 Mô 25 mẫu cỡ 20 từ phân phối N (50, 62) tìm 95% CI cho mẫu a Có khoảng số khoảng chứa giá trị trung bình thực 50? sai có nghĩa 53? Thực tạo ngẫu nhiên 25 mẫu (x = 25) với kích thước n = 20 từ phân bố chuẩn Minitab thực tính khoảng tin cậy 95% cho mẫu, ta kết sau Trang Từ bảng giá trị ta thấy số khoảng chứa giá trị trung bình 50 là: 20 khoảng giá trị (tất khoảng giá trị), chứa giá trị trung bình 53 khoảng khoảng giá trị b Nếu kích thước mẫu tăng lên n = 100, điều xảy với chiều rộng 95% CI? Bạn có mong đợi nhiều hay khoảng chứa giá trị trung bình thực 50? sai có nghĩa 53? Với kích thước mẫu tăng lên 100 độ rộng khoảng tin cậy không đổi số mẫu không đổi Khoảng tin cậy có chứa giá trị trung bình 50 khơng có tất khoảng giá trị mà có khoảng 95 khoảng giá trị Khoảng tin cậy có chứa giá trị 53 nhiều hơn, khoảng 30 khoảng giá trị c Nếu giá trị trung bình thực 50, ta cho khoảng giá trị cách sử dụng công thức theo Z để kiểm chứng µ Khồng tin cậy tính sau: 𝜎 𝜎 [𝑋̅ − 𝑧𝛼⁄2 ; 𝑋̅ + 𝑧𝛼⁄2 ] √𝑛 √𝑛 6.13 Giả sử 100 mẫu ngẫu nhiên có kích thước tạo từ phân phối N (70, 32) CI 95% liên quan tính cho mẫu a Có khoảng 100 khoảng có chứa giá trị trung bình 𝜇 = 70? Khoảng tin cậy có mức độ tin cậy 95% nên có 100 x 0,95 = 95 khoảng tin cậy có chứa giá trị trung bình 𝜇 = 70 b Gọi X khoảng số 100 khoảng có chứa Sự phân bố r.v X là: Phân bố X phân bố nhị thức với X ~ Bin (100, 0.95) 6.14 Một mẫu ngẫu nhiên có kích thước 25 từ phân phối N (, 62) có giá trị trung bình x = 16,3 Trang a Tính CI cho để có ba mức độ tin cậy: 80%, 90%, 99% Độ rộng CI thay đổi nào? ( x = 16,3, = ) Khồng tin cậy giá trị có khoảng tin cậy – α là: 𝜎 𝜎 [𝑋̅ − 𝑧𝛼⁄2 ; 𝑋̅ + 𝑧𝛼⁄2 ] √𝑛 √𝑛 +) Với độ tin cậy 80% – α = 0,8 α = 0,2, 𝑧𝛼∕2 = 𝑧0,1 = 1,282 Khoảng tin cậy [16,3 – 1,282 √25 ; 16,3 + 1,282 √25 ] = [14,7616; 17,8384] Tương tự với khoảng tin cậy 90% 99% ứng với z0,05 = 1,645 z0,005 = 2,576 Với khoảng tin cậy 90%: [14,326; 18,274] Khoảng tin cậy 99%: [13,2088; 19,3912] Nhận thấy độ rộng khoảng tin cậy tăng lên ta tăng mức độ tin cậy b Độ rộng khoảng tin cậy tăng n lên 100 𝜎 Độ rộng khoảng tin cậy 2𝑧𝛼/2 ⋅ √𝑛 Khi n tăng lên 100 n tăng lên lần cịn √𝑛 tăng lên lần độ rộng khoảng tin cậy giảm lần 6.15 Chúng tơi muốn ước tính điện áp đầu trung bình loạt đơn vị cung cấp điện Một mẫu ngẫu nhiên gồm 10 đơn vị thử nghiệm giá trị trung bình mẫu tính 110,5 vôn Giả sử phép đo phân phối bình thường với =3vơn a Tính CI 95% hai phía điện áp đầu trung bình Giả sử thông số kỹ thuật điện áp đầu trung bình thực 110 2,5volt, CI có đáp ứng hay không? 𝜎 𝜎 Khoảng tin cậy sau: [𝑋̅ − 𝑧𝛼⁄2 ; 𝑋̅ + 𝑧𝛼⁄2 ], √𝑛 √𝑛 Ta có độ tin cậy 95% nên 𝛼 = 0,05 𝑧𝛼∕2 = z0,025 = 1,96 Thay giá trị 𝑋̅ = 110,5V; n = 10, =3, z0,025 = 1,96, khoảng tin cậy với mức độ tin cậy 95% [110,5 – 1,96 √10 ; 110,5 + 1,96 √10 ] = [108,64; 112,36] Với giá trị trung bình thực 110 2,5 (V) khoảng tin cậy với độ tin cậy 95% hợp lý b Giả sử áp dụng thơng số kĩ thuật thấp Tính CI 95% phía thích hợp điện áp đầu trung bình giải thích cách sử dụng để kiểm tra xem giới hạn thơng số kỹ thuật thấp có đáp ứng hay không? Áp dụng thông số kĩ thuật thấp khoảng tin cậy có độ tin cậy 95% 𝜎 [𝑥̅ − 𝑧𝛼 ⋅ ; ∞) √𝑛 Thay số z0,05 = 1,645, 𝑋̅ = 110,5V, =3, n = 10 khoảng tin cậy [110,5 – 1,645 √10 ; ∞) = [108,9; ∞) Vì 108,9 lớn giá trị giới hạn nhỏ 107,5 khoảng tin cậy đáp ứng Trang c Giả sử áp dụng thông số kỹ thuật trên, mối quan tâm điện áp q cao gây cố thiết bị Tính độ tin cậy 95% phía thích hợp tìm thấy điện áp đầu trung bình giải thích cách sử dụng để kiểm tra xem giới hạn thơng số kỹ thuật có đáp ứng hay khơng? Áp dụng cơng thức tính khoảng tin cậy chiều với điện áp cao sau 𝜎 (−∞; ̅𝑥 + 𝑧𝛼 ⋅ ] √𝑛 Thay số z0,05 = 1,645, 𝑋̅ = 110,5V, =3, n = 10 khoảng tin cậy (− ∞; 110,5 + 1,645 √10 ] = (− ∞; 112,06] Ta có 112,06 nhỏ giá trị giới hạn 112,5 khoảng tin cậy chiều cao thỏa mãn 6.16 Gọi X1, X2, , Xn mẫu ngẫu nhiên từ phân phối liên tục với trung vị Nếu [Xmin, Xmax] sử dụng làm CI cho , mức độ tin cậy bao nhiêu? Mức độ tin cậy n = 10? Bài giải: Với biến X ngẫu nhiên liên tục ln có: P (X ≤ a) = P (X < a) Do 𝜇̅ giá trị trung vị mẫu nên ta có P (xi < 𝜇̅ ) = 0,5 Ta có P (Xmin > 𝜇̅ ) = – F(1)(𝜇̅ ) = (1 – F(𝜇̅ ))n = P (Xmax < 𝜇̅ ) = F(n)(𝜇̅ ) = [F(𝜇̅ )]n = Ta có giá trị 2𝑛 2𝑛 2𝑛 giá trị xác suất ước lượng xác suất ước lượng nên độ tin cậy khoảng giá trị [Xmin, Xmax] Confident Level = 2𝑛 + 2𝑛 = 2𝑛 = 2𝑛−1 Với n = 10 khoảng tin cậy là: Confident Level = 2𝑛 + 2𝑛 = 2𝑛 = 2𝑛−1 = 29 Phần 6.3 6.17 Trong trường hợp sau, nêu giả thuyết vô hiệu Ho giả thuyết thay H1 tỷ lệ dân số p kiểm tra Giải thích p giả thiết a Người chiến thắng bầu cử quốc hội vừa qua nhận 54% số phiếu bầu Một năm trước bầu cử tiếp theo, nghị sĩ thuê quan bỏ phiếu để tiến hành khảo sát lấy mẫu cử tri để xác định xem liệu quy trình có thay đổi hay khơng Answer: Do câu hỏi liệu tỉ lệ trúng cử nghị sĩ quốc hội có thay đổi hay không nên kiểm tra giả thuyết chiều nên H0: p = 54%, H1: p ≠ 54%, p tỷ lệ thực tế số người vote cho nghị sĩ quốc hội b Tỷ lệ sách hạn thư viện 5% Tôi dự kiến tăng tiền phạt cho sách hạn từ xu lên 10 xu ngày Người ta cảm thấy điều làm giảm tỷ lệ sách hạn Trang Answer: Câu hỏi tỉ lệ p cúa sách hạn giữ nguyên hay giảm xuống nên giả thiết chiều với ước lượng thấp ta có: Ho: p = 5% H1: p < 5%, p tỉ lệ sách hạn c Tỷ lệ phế phẩm vật liệu chế tạo thùng rác cao 40% Một sản xuất quy trình đề xuất để giảm tỷ lệ phế phẩm Answer: Ở giả thiết giả thiết chiều với ước lượng thấp ta có giả thiết: Ho: p = 40%, H1: p < 40%, p tỷ lệ phế phẩm d Gatorade All Sport hai loại đồ uống phổ biến vận động viên Một công ty tiếp thị muốn xác định xem tỷ lệ người thích hương vị Gatorade hay All Spurt nhiều Vì mục đích này, kiểm tra mù tiến hành hai loại đồ uống cung cấp theo thứ tự ngẫu nhiên cho người yêu thích Bậc thầy, người sau u cầu sở thích đồ uống hay đồ uống khác Answer: Xác suất p thích Gatorade hay All Sport nhiều Khơng thể biết đồ ăn tỷ lệ thích giả thiết chiều với p = ½ p ≠ ½ p = P (là tỉ lệ thích Gatorade 6.18 Trong phương án sau nêu giả thuyết vô hiệu Ho giả thuyết thay H1 trung bình dân số p kiểm định Giải thích p trường hợp a Một nhóm quan giám sát người tiêu dùng nghi ngờ loại sữa chua quảng cáo khơng có chất béo 98% thực có hàm lượng chất béo cao Nhóm dự kiến đo hàm lượng chất béo 25 cốc sữa chua (mỗi cốc chứa 170 gram) để xác minh nghi ngờ hàm lượng chất béo trung bình thực cốc 2%, tức 3,4 gam Answer: Phương án kiểm định hàm lượng chất béo hay lớn 3,4g, thiết chiều với ước lượng cao vây giả thiết là: H0: 𝜇 = 3,4g; H1: 𝜇 > 3,4 g b Thông số kỹ thuật với độ bền cắt dây buộc sử dụng lắp ráp khí 10.000 psi Một mẫu dây buộc ngẫu nhiên từ lô lớn nhà cung cấp cung cấp thử nghiệm để xem liệu độ bền cắt trung bình lơ có đáp ứng u cầu kỹ thuật hay khơng Hãy xem xét hai tình huống: (i) Nhà cung cấp người mới, có lịch sử q khứ chất lượng lô hàng họ (ii) Nhà cung cấp cũ lịch sử khứ cho thấy lô họ thường đáp ứng thông số kỹ thuật Answer: Giá trị trung bình độ bền cắt dây buộc lắp ráp khí, Ho: 𝜇 = 10000 psi Trường hợp 1: Nhà cung cấp người mới, chưa có lịch sử q khứ chất lượng lơ hang họ trường hợp độ bền cắt dây phải đủ lớn H1: 𝜇>10000 Trường hợp 2: Nhà cung cấp cũ lịch sử khứ cho thấy lô họ thường đáp ứng thông số kĩ thuật nên H1: 𝜇 < 10000 Trang c Thời gian làm trung bình người làm từ đến nơi làm việc 25 phút Anh ta muốn thử tuyến đường khác tháng để xem liệu có làm giảm thời gian làm trung bình hay khơng Answer: Ở thời gian làm việc trung bình hay 25 phút Do ước lượng chiều với ước lượng thấp hơn: H0: 𝜇 = 25; H1: 𝜇 < 25 d Tham khảo phần (d) tập trước, thay đơn giản sở thích, giả sử người nếm thử định số điểm thang điểm từ đến 10 cho đồ uống Sự khác biệt Gatorade All Sport thử tạo thành tập liệu Answer: 𝜇 giá trị trung bình khác điểm, giả thiết chiều với H0: 𝜇 = H1: 𝜇 ≠ 6.19 Trong trường hợp sau, giải thích giả thuyết nên thiết lập giá vô hiệu giả thuyết nên thiết lập làm phương án thay cách định giả thuyết phản ánh khơng xác, dẫn đến sai sót nghiêm trọng Đây giả thuyết nên thiết lập vô hiệu Nêu giả định mà bạn đưa a Một hợp chất hóa học sử dụng làm chất phụ gia bị nghi ngờ chất gây ung thư Hai giả thuyết đưa là: (i) an tồn, (ii) khơng an tồn với lượng tiêu thụ thơng thường Answer: Ở H0: (ii) khơng an tồn với lượng tiêu thụ thơng thường; H1: an tồn Giả định khơng thể kết luận sản phẩm an tồn giả định khơng an tồn chúng khơng an tồn khơng nên bán thị trường b Một loại thuốc giảm đau phát triển công ty dược phẩm giả thiết là: (i) có hiệu (ii) khơng hiệu Answer: Ở H0: (ii) khơng hiệu H1: (i) Nó hiệu Nếu (i), loại thuốc giảm đau có hiệu bị từ chối có hiệu quả, loại thuốc hữu ích khơng bán thị trường Nếu (ii), thuốc giảm đau hiệu quả, bị từ chối thực khơng hiệu quả, loại thuốc khơng hữu ích bán thị trường Nhưng có thuốc giảm đau hiệu quả, tạo (ii) H0 c Để sản phẩm chung quan quản lý chấp thuận, phải chứng minh Ngồi ra, tương thích mặt sinh học với thuốc gốc Hai giả thuyết là: (i) tương đương sinh học, (ii) khơng tương đương sinh học Answer: H0: Nó khơng tương đương sinh học; H1: Nó tương đương sinh học d Người ta khẳng định gieo hạt theo đám mây kỹ thuật hiệu để tăng lượng mưa Hai giả thuyết là: (i) hiệu quả, (ii) khơng hiệu Answer: H0: khơng hiệu quả; H1: hiệu Nếu (i), tạo mây làm tăng lượng mưa, bị từ chối, sử dụng cách để tạo mưa Nếu (ii), việc gieo hạt đám mây không làm tăng lượng mưa, bị từ chối, kỹ thuật không hiệu đưa vào thực tế Trang 10 4.20 Cho X Bernoulli r.v với P (X = 1) = p P (X = 0) = - p Chúng ta muốn kiểm tra Ho: p = 1/4 H1: p= ¾ a Giả sử dựa quan sát X, quy tắc định là: không bác bỏ Ho X = 0; bác bỏ Ho X= Tìm xác suất lỗi loại I loại II? Xác suất lỗi loại I α = P (type I error) = P (Reject H0| H0 true) = P (X = 1| H0: p = ¼) = ¼ Xác suất lỗi loại II là: Β = P (type II error) = P (Do not reject H0|H0 false) = P (X = 0| H1: p = ¾) = – ¾ = ¼ b Giả sử dựa hai i.i.d quan sát X1 X2 quy tắc định là: không bác bỏ Ho X1 + X2 = 1; khơng từ chối Ho Tìm xác suất lỗi loại I loại II cho quy tắc Xác suất loại I quy tắc là: 𝛼 = P (type I error) = P (Reject H0| H0 true) = P (2 successes|H0: p = ¼) = (1/4)2 = 1/16 Xác suất loại II quy tắc là: Β = P (type II error) = P (Do not reject H0|H0 false) = P (not successes|H0: p = ¾) = = – (3/4)2 = 7/16 6.21 Xem xét kế hoạch lấy mẫu chấp nhận lấy mẫu ngẫu nhiên gồm 50 từ lô lớn chấp nhận Int số lượng thám tử không q 2; khơng từ chối nhiều Gọi p phân số chưa biết bị lỗi lô Lô hàng coi “đạt yêu cầu” p= 0,02 trở xuống “không đạt yêu cầu” p = 0,1 trở lên Vẽ đường cong OC quy tắc cách tính xác suất chấp nhận Ho cho p= 0,01 đến 0,05 bước 0.01 p = 0.05 đến 0.20 bước 0.05 Nguy hay cung cấp giá trị quy tắc cho p= 0,02 p= 0.1, tương ứng? Công suất p= 0,15 𝟐 Bài giải: Cơng thức tính OC: OC (p) = ∑ 𝒊=𝟎 ( 𝟓𝟎 ) ⋅ 𝒑𝒊 ⋅ (𝟏 − 𝑷)𝟓𝟎−𝒊 𝒊 Ta có bảng giá trị p OC (p) sau: Xác suất Số lượng chấp nhận 0,01 0,02 0,03 0,04 0,05 0,1 0,15 0,2 Số mẫu 50 50 50 50 50 50 50 50 OC (p) 0,986 0,922 0,811 0,677 0,541 0,112 0,014 0,001 Và đồ thị đường OC (p) Trang 11 Dựa vào đồ thị ta thấy: 𝛼 = – 0,922 = 0,778; 𝛽 = 0,112 Power (0,15) = – P (Type error) = – 𝛽 = 1- 0,014 = 0,986 6.22 Tham khảo Bài tập 6.17, phần (d) Gọi p tỷ lệ người dân số thích Gatorade Tất môn thể thao Chúng muốn định xem có nhiều người thích Gatorade khơng Các giả thuyết thiết lập dạng Ho: p 1/2 trái lại H1: p > 1/2 15 người nếm thử tham gia vào thí nghiệm kiểm tra mùi vị a Giả sử 11 số 15 người thử nghiệm thích Gatorade All Sport Cái giá trị P? Bạn từ chối Ho = 0.10 không Answer: Cho X số người thử vị thích Gatorade tất mơn thể thao Giá trị p- value mức ý nghĩa quan sát, mức α nhỏ mà kết thử nghiệm quan sát có ý nghĩa Nếu α > P ta từ chối H0, cịn α < P ta khơng từ chối H0 Do p- value xác suất H0 thu kết cực đoan kết quan sát Ở H0 ta có xác suất p = xác suất 11 người nhiều 15 người tham gia thử vị p = ½ là: P (X ≥ 11), ta có n = 15 p = ½, tra bảng ta có P (X < 11) = P (X≤10) = 0,941, vậy: P (X ≥ 11) = - 0,941 = 0,059 Vì P < 0,10, ta bác bỏ H0 α = 0,10 kiểm định giả thiết chiều với 90% kết luận p khơng nhỏ ½, Gartorade thích All Sport b Giả sử tiên nghiệm khơng có lý để tun bố loại đồ uống ưa thích đồ uống khác Chúng tơi muốn thí nghiệm kiểm tra mùi vị cho chúng tơi biết liệu có khác biệt đáng kể hay khơng, có, hướng Do đó, giả thuyết thay Hiện hai phía Giá trị P gì? bạn từ chối Ho =0.10? Answer: Ở xác suất tính xác suất 11 người nhiều người thích đồ uống p = ½, ta cần phải tìm P (X ≥ 11 or X ≤ 4) = 0,059 + 0,059 = 0,118 Khi P > 0,10, H0 khơng thể bác bỏ α = 0,10, giả thiết chiều 90% khơng thể kết luận khác sở thích loại đồ uống Trang 12 6.23 Mục đích tập cung cấp cho bạn cảm giác rủi ro kiểm tra tỷ lệ lỗi loại I loại II chuỗi dài ứng dụng kiểm tra Ho H1 đúng, tương ứng Xem xét kiểm định Ho: = H1: > mức ý nghĩa 5% dựa mẫu có kích thước từ phân phối chuẩn trung bình khơng biết biết = a Rủi ro thứ quy tắc gì? Rủi ro quy tắc =1 𝜎 Answer: Ta có: 𝑥̅ = 𝜇 + 𝑧0,05 (thay 𝜇 = 0; z0,05 = 1,645, 𝜎 =1 n = 9), 𝑥̅ = 0,548 √𝑛 α = P (Type I error) = P (𝑥̅ > 0,548| 𝜇 = 0) = P (Z > 1,644) = – P (Z≤ 1,644) = 0,05 β = P (Type II error) = P (𝑥̅ ≤ 0,548| = ) = P (Z ≤ - 1,356) = 0,087 b Mô thời gian thử nghiệm cho = (bằng cách vẽ mẫu có kích thước từ phân bố N (0,1) thực thử nghiệm) đếm tỷ lệ số lần lỗi I cam kết (Ho bị từ chối) Lặp lại với = tính tỷ lệ số lần lỗi loại II phạm phải (Ho không bị từ chối) Tỷ lệ gần với rủi ro và ? 𝜎 Answer: Ta có 𝑥̅ = 𝜇 + 𝑧0,05 √𝑛 thay 𝜇 = 0; z0,05 = 1,645, 𝜎 =1 n = 9) 𝑥̅ = 0,548 thay 𝜇 = 1; z0,05 = 1,645, 𝜎 =1 n = 9), 𝑥̅ = 1,548 α = P (Type I error) = P (𝑥̅ > 0,548| 𝜇 = 0) = P (Z > 1,644) = – P (Z≤ 1,644) = 0,05 β = P (Type II error) = P (𝑥̅ ≤ 1,548| = ) = P (Z ≤ 1,644) = 0,05 Tỉ lệ gần với tỉ lệ tính câu a 6.24 Một cơng ty mua ốc vít kim loại theo lơ lớn Độ bền cắt trung bình phải l0,000 psi để lơ hàng chấp nhận Điều hình thành vấn đề kiểm tra giả thuyết với Ho: l0,000 ngược lại H1: > 10,000 Một mẫu gồm 10 ốc vít thử nghiệm, giá trị trung bình mẫu vượt q 10.500 psi, Ho bị loại lơ chấp nhận Giả sử =1000 psi Tính tốn rủi ro cho quy tắc =10000 11000 psi, tương ứng Bài giải: 𝑥̅ = 10500 psi, =1000 psi, n =10, Ho: =10000, H1: =11000, Z = 𝑥̅ −𝜇 𝜎∕√𝑛 α = P (Type error 1) = P (𝑥̅ > 10500| =10000) = P (Z > 1,581|=10000) = – 0,9431 = 0,0569 β = P (Type error II) = P (𝑥̅ ≤ 10500| = 11000) = P (Z ≤ -1,581) = 0,057 Power = – β = – 0,057 = 0,943 6.25 Tham khảo tập 6.24 Vẽ đường cong OC quy tắc cách tính tốn khả khơng từ chối Ho giá trị từ 9600 đến 11.600 bước 200 𝑥̅ = 10500 psi, =1000 psi, n =10, Z = OC (p) = P (Z < 10500−𝜇 𝑥̅ −𝜇 𝜎∕√𝑛 ) 1000∕√10 Trang 13 Bảng giá trị đồ thị đường cong OC (p) quy tắc là: 9600 9800 10000 10200 10400 10600 10800 11000 11200 11400 11600 Xác suất 0,99779 0,98657 0,94308 0,82861 0,62409 0,37591 0,17139 0,05692 0,01343 0,00221 0,00025 6.26 Tham khảo Bài tập 6.25 Giả sử công ty muốn kiểm soát rủi ro mức 0,01 Quy tắc định mặt x gì? Rủi ro cơng suất = 11,000 psi? Lặp lại phép tính với giả định cỡ mẫu 20 Bạn kết luận gì? Bài giải: Quy tắc định 𝑥̅ P (𝑥̅ > 10.500| p =0,99) Rủi ro 𝛽 = 11000 psi 0,05692 Power = – β = – 0,05692 = 0,94308 Lặp lại với cỡ mẫu n = 20: P (𝑥̅ ≤ 10500| = 11000) = P (Z ≤ -2,236) = 0,01 Khi n = 20 giá trị β nhỏ 6.27 Để rút ngắn thời gian chu kỳ quy trình lắp ráp, kỹ sư cơng nghiệp đơn giản hóa- hoàn thiện hoạt động thiết kế cố định Với phương pháp cũ, thời gian trung bình cho lắp ráp 10 phút Để kiểm tra tun bố mình, thí nghiệm tiến hành 15 cơng nhân đào tạo theo phương pháp tham gia a Thiết lập giả thuyết để thời gian lắp ráp trung bình với phương pháp 10 phút: giả thuyết H0: 𝜇 = 10 mins; H1: 𝜇 < 10 mins b Giả sử trung bình mẫu 15 công nhân 8,7 phút Nếu = phút có chứng có ý nghĩa thống kê thời gian trung bình giảm xuống? Sử dụng = 0,05 Ta có Z = 𝑥̅ −𝜇 𝜎∕√𝑛 ; thay số: 𝑥̅ = 8,7; 𝜇 = 10; n = 15; 𝜎 = ta z = - 2,517 Ta có z < - z0,05 (-2,517 < -1,645), ta bác bỏ H0 thấy thời giant trung bình 𝜇 giảm xuống c Kỹ sư công nghiệp tuyên bố phương pháp giảm thời gian trung bình 1,5 phút Tính hội để thử nghiệm thử nghiệm Power = 0,8962 (???) Trang 14 6.28 Năm 1993, gia đình Mỹ điển hình chi 22% thu nhập sau thuế cho quần áo, giải trí hoạt động khác 78% cịn lại chi cho nhu cầu thiết yếu nhà ở, thực phẩm, phương tiện lại, chăm sóc sức khỏe bảo hiểm đề xuất chi phí thiết yếu tăng kể từ năm 1993, tỷ lệ phần trăm thu nhập trung bình chi cho ba mặt hàng giảm Để kiểm tra đề xuất đề xuất này, mẫu ngẫu nhiên gồm 50 hộ gia đình lấy xác định tỷ lệ phần trăm chi tiêu cho ba mặt hàng Giả sử tỷ lệ phần trăm thay đổi gia đình theo phân phối chuẩn với p trung bình chưa biết = 5% biết (Lưu ý tỷ lệ phần trăm tỷ lệ nhị thức) a Thiết lập giả thiết 𝜇: 𝜇0 = 𝑥̅ + 𝑧𝛼 ⋅ 𝜎 √𝑛 H0: 𝜇 = 𝜇0 ; H1: 𝜇 < 𝜇0 b Nếu tỷ lệ phần trăm trung bình 50 gia đình 20,5%, bạn có kết luận mức giảm đáng kể so với mức năm 1993 không? Sử dụng =0.01 Ta có x = 22%, 𝜇 = 20,5; = 5%; n = 50 Nên: z = 2,121 < z0,10 = 2,3263 (Để từ chối H0 z < -z0,01) Vậy trường hợp ta kết luận là mức giảm đáng kể so với năm 1993 c Tiến hành thử nghiệm (b) cách tính giá trị P Z = 2,121; P = 0,9803 6.29 Ví dụ 6.26 sử dụng biểu đồ kiểm sốt sigma để kiểm sốt giá trị trung bình trình Ở số quốc gia, biểu đồ kiểm soát 2.5-sigma sử dụng, tức giới hạn kiểm soát o - 2.5 / n o + 2.5 / n , o giá trị mục tiêu cho giá trị trung bình trình , độ lệch chuẩn trình, n cỡ mẫu a Sử dụng liệu từ Ví dụ 6.26 để tính tốn giới hạn kiểm soát rủi ro α cho biểu đồ kiểm soát 2,5 𝜎 So sánh kết với biểu đồ kiểm soát 3-sigma nhận xét Answer: Số liệu từ ví dụ 6.26: = = n = Giới hạn kiểm soát 2,5 sigma tính [o - 2.5 / n ; 𝜇0 + 2.5/ n ] = [15,888; 16,112] So sánh với khoảng kiểm soát sigma [15,186; 16,134]; giới hạn kiểm soát sigma rộng giới hạn kiểm soát 2,5 sigma Giá trị rủi ro α biểu đồ kiểm soát 2,5 sigma α = P (𝑥̅ > 16,112) + P (𝑥̅ < 15,888) = P (Z > 2,50) + P (Z dựa mẫu ngẫu nhiên có kích thước n từ phân phối N (, 1) Tính giá trị P cho ba trường hợp sau: (i) x = 0,1, n =100, (ii) x = 0,1, n = 400, (iii) x = 0,1, n = 900 Bạn kết luận Bài giải: x = 0,1, 𝜎 = 1; = P- value = P (𝑥̅ > 0,1| = 0) = – P (𝑥̅ ≤ 0,1| = 0) = – P (𝑥̅ ≤ 𝑥̅ −𝜇 𝜎∕√𝑛 ) Với n = 100; P – value = – ø (1) = – 0,8413 = 0,1587 Với n = 400; P – value = – ø (2) = – 0,9772 = 0,0228 Với n = 900; P – value = – ø (3) = – 0,9987 = 0,0013 Nhận thấy kích thước mẫu lớn giá trị P nhỏ cho thấy khác biệt nhỏ so với giá trị trung bình giả thuyết có ý nghĩa kích thước mẫu đủ lớn Bài tập nâng cao 6.32 Gọi X1, X2, , Xn mẫu ngẫu nhiên từ phân phối đồng khoảng (0, ) có nghĩa = /2 phương sai 2= 2/12 Hãy xem xét hai ước lượng : 𝜃̂1 = 𝑥max ; 𝜃2 = 2𝑥̅ Trang 16 ˆ ˆ ˆ a Sử dụng kết Bài tập 5.44 (b) để tìm E ( ), Var ( ) MSE ( ) 𝑡 𝑛−1 Kết 5.44: f(n) = 𝑛 ⋅ ( ) 𝜃 +) E (𝜃̂1 ) = E (Xn) = 𝜃 𝑛 𝑡 ∫ 𝑛 𝜃 𝑛 ⅆ𝑡 = 𝑛 𝑛+1 ⋅ 𝜃 𝑛 ⋅ 𝜃 = 2𝜇 ⋅ 𝑛+1 +) Var (𝜃̂1 ) = E (𝑋𝑛2 ) – (E (Xn))2 Ta có: E (𝑋𝑛2 ) = 𝑛 𝜃 𝑛 𝑛 𝑛 ∫ 𝑡 𝑛+1 ⅆ𝑡 = 𝑛+2 𝜃 = 𝑛+2 (2𝜇)2 = 4𝜇2 ⋅ 𝑛+2 𝜃𝑛 Var (𝜃̂1 )= E (𝑋𝑛2 ) – (E (Xn))2 = 𝑛 𝑛+2 𝜃2 − ( 𝑛 𝑛+1 𝑛 𝑛 𝜃) =𝜃 ((𝑛+2)(𝑛+1)2 ) = ((𝑛+2)(𝑛+1)2) +) MSE (𝜃̂1 ) = Var (𝜃̂1 ) + (Bias (𝜃̂1 )) 𝑛 −𝜃 Bias (𝜃̂1 ) = E (𝜃̂1 ) – 𝜃 = 𝜃−𝜃= 𝑛+1 𝑛+1 𝑛+1 MSE (𝜃̂1 ) = Var (𝜃̂1 ) + (Bias (𝜃̂1 ))2 = 2𝜃 ⋅ ((𝑛+2)(𝑛+1)2 ) = 2𝜃 ⋅ ((𝑛+2)(𝑛+1)) ˆ ˆ ˆ b Tìm E ( ), Var ( ) MSE ( ) +) E (𝜃̂2 ) = E (2𝑥̅ ) = E (𝑥̅ ) = 2𝜇 = 𝜃 +) Var (𝜃̂2 ) = Var (2𝑥̅ ) = Var (𝑥̅ ) = 𝜎2 𝑛 = 𝜃 12 𝑛 = 𝜃2 3𝑛 +) MSE (𝜃̂2 ) = Var (𝜃̂2 ) + (Bias (𝜃̂2 ))2 Bias (𝜃̂2 ) = E (𝜃̂2 ) - 𝜃 = Vậy MSE (𝜃̂2 ) = Var (𝜃̂2 ) = 𝜃2 3𝑛 c So sánh MSE (𝜃̂1 ) MSE (𝜃̂2 ): MSE (𝜃̂1 ) ≤ MSE (𝜃̂2 ) 6.27c, 6.33, 6.34, 6.35 Trang 17 ... [14, 761 6; 17,8384] Tương tự với khoảng tin cậy 90% 99% ứng với z0,05 = 1 ,64 5 z0,005 = 2,5 76 Với khoảng tin cậy 90%: [14,3 26; 18,274] Khoảng tin cậy 99%: [13,2088; 19,3912] Nhận thấy độ rộng khoảng. .. khoảng tin cậy tăng lên ta tăng mức độ tin cậy b Độ rộng khoảng tin cậy tăng n lên 100