Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 69 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
69
Dung lượng
2,29 MB
Nội dung
Bài KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Wednesday, November 29, 2017 Nội dung • Giới thiệu tốn kiểm định • Kiểm định trung bình µ tỷ lệ p • Kiểm định hiệu trung bình 𝝁𝟏 − 𝝁𝟐 hiệu tỷ lệ 𝒑𝟏 − 𝒑𝟐 Wednesday, November 29, 2017 29-Nov-17 Giới thiệu toán kiểm định Thực tế: Cần khảo sát tuổi trung bình tổng thể nhiều người (người ta đưa giả thiết 40 tuổi) (Null Hypothesis: H0: = 40 ) Population Với kết khảo sát ta kết luận tổng thể có trung bình 𝝁 =40 hay khơng ? • Nên chấp nhận hay bác bỏ 𝑯𝒐 ? • Độ tin cậy định ? Lấy mẫu ngẫu nhiên để khảo sát Kết khảo sát: ഥ = 𝟑𝟓 𝒙 Sample Phân biệt ước lượng kiểm định ഥ Phân phối 𝑿 Chấp nhận 𝑯𝟎 95% Bác bỏ 𝑯𝟎 ഥ = 𝟑5 𝒙 𝝁 = 𝝁𝒐 = 𝟒𝟎 Giá trị tới hạn – Critical Value • Kiểm định: Ta giả sử giả thiết ban đầu Ho : 𝝁 = 𝝁𝒐 = 𝟒𝟎 cho tìm sở để chấp nhận hay bác bỏ 𝐻𝑜 • Tiến hành lấy mẫu tính tốn 𝑥ҧ • Nếu 𝑥ҧ gần 𝝁𝒐 : chấp nhận 𝐻𝑜 Cần có tiêu chuẩn để biết chấp nhận hay bác bỏ • Nếu 𝑥ҧ x𝐚 𝝁𝒐 : bác bỏ 𝐻𝑜 29-Nov-17 Đặt giả thiết thống kê • Giả thiết thống kê: Là phát biểu tham số tổng thể Ví dụ : – “Chiều cao trung bình sv 165cm” – “Chiều cao trung bình sv lớn 165cm” – “Chiều cao trung bình sv bé 165cm” • Phân loại: giả thiết 𝑯𝟎 giả thiết đối 𝑯𝟏 • Giả thiết 𝐻0 : cịn gọi giả thiết khơng Tức giả thiết có dấu (gồm trường hợp: 𝜽 = 𝜽𝟎 , 𝜽 ≥ 𝜽𝟎 , 𝜽 ≤ 𝜽𝟎 ) • Giả thiết đối 𝐻1 : giả thiết ngược lại với 𝑯𝟎 29-Nov-17 Đặt giả thiết thống kê Chúng ta có cách đặt giả thiết thống kê để kiểm định: Kiểm định phía • 𝑯𝟎 : 𝜽 = 𝜽𝟎 • 𝑯𝟏 : 𝜽 ≠ 𝜽𝟎 Kiểm định bên trái • 𝑯𝟎 : 𝜽 ≥ 𝜽𝟎 • 𝑯𝟏 : 𝜽 < 𝜽𝟎 ghi 𝑯𝟎 : 𝜽 = 𝜽𝟎 Kiểm định bên phải • 𝑯𝟎 : 𝜽 ≤ 𝜽𝟎 • 𝑯𝟏 : 𝜽 > 𝜽𝟎 ghi 𝑯𝟎 : 𝜽 = 𝜽𝟎 Lưu ý: dấu “ = “ nằm giả thiết 𝐻0 29-Nov-17 Đặt giả thiết thống kê Ví dụ: giả thiết chiều cao trung bình sv 𝐻0 : 𝜇 = 𝜇0 = 165cm (chiều cao 165 cm) 𝐻1 : 𝜇 ≠ 165 (hay 𝜇 < 165 hay 𝜇 > 165) Ví dụ: giả thiết tỷ lệ sản phẩm tốt 𝐻0 : 𝑝 = 𝑝0 = 85% 𝐻1 : 𝑝 ≠ 85% (hay 𝑝 < 85% hay 𝑝 > 85%) Giả thiết 𝐻1 chọn tùy theo yêu cầu thực tế mục đích người nghiên cứu Ví dụ: – KĐ: “Chiều cao trung bình sv thấp 165cm?” → bên trái – KĐ: “Chiều cao trung bình sv khác 165cm?” → hai phía 29-Nov-17 Ví dụ đặt giả thiết Ví dụ: • Nhà trường tun bố chiều cao t.bình sv 𝝁 = 𝝁𝟎 = 𝟏𝟔𝟓cm • Chúng ta cần kiểm định khẳng định nhà trường có hay khơng? • Chọn mẫu ngẫu nhiên gồm 100 sinh viên, thấy chiều cao trung bình ഥ = 𝟏𝟔𝟐𝒄𝒎 mẫu là: 𝒙 • Ta chọn cách đặt giả thiết 𝐻1 tùy mục đích người kiểm định: 𝐻1 : 𝜇 < 𝜇0 (kiểm định bên trái) : “Chiều cao trung bình sv thấp 165cm?” 𝐻1 : 𝜇 ≠ 𝜇0 (kiểm định hai phía): “Chiều cao trung bình sv khác 165cm Quiz: Hãy viết giả thiết 𝐻0 tương ứng trường hợp 29-Nov-17 Sai lầm mức ý nghĩa α • Mục tiêu: kiểm định giả thiết cho xác suất phạm phải sai lầm đưa định nhỏ • Ta có hai loại sai lầm: – Sai lầm loại I: bác bỏ 𝑯𝟎 |𝑯𝟎 – Sai lầm loại II: chấp nhận 𝑯𝟎 |𝑯𝟎 sai • Mức ý nghĩa 𝛼 = xác suất mắc phải sai lầm loại I (the significance level of the test) 𝜶 = P (reject 𝑯𝟎 𝑯𝟎 true 29-Nov-17 Nguyễn Phi Hùng 10 σ1 σ2 biết • Biết σ1 σ2 • Kích thước mẫu (𝒏𝟏 , 𝒏𝟐 bất kỳ) • Ta sử dụng PP chuẩn independent samples σ1 and σ2 known σ1 and σ2 unknown, n1 and n2 30 σ1 and σ2 unknown, n1 or n2 < 30 * z x x2 σ12 σ 2 n1 n σ1 σ2 ko biết mẫu lớn • Khơng biết σ1 σ2 • Mẫu lớn 𝒏𝟏 , 𝒏𝟐 ≥ 𝟑𝟎 independent samples • Ta sử dụng PP chuẩn σ1 and σ2 known σ1 and σ2 unknown, n1 and n2 30 σ1 and σ2 unknown, n1 or n2 < 30 * 𝒁= 𝒙𝟏 − 𝒙𝟐 𝟐 𝟐 𝒔ෞ𝟏 𝒔ෞ𝟐 + 𝒏𝟏 𝒏𝟐 σ1 σ2 ko biết mẫu nhỏ • Khơng biết σ1 σ2 • Mẫu bé 𝒏𝟏 , 𝒏𝟐 < 𝟑𝟎 • Ta sử dụng PP Student với (𝒏𝟏 + 𝒏𝟐 − 𝟐) bậc tự independent samples t σ1 and σ2 known sp σ1 and σ2 unknown, n1 and n2 30 σ1 and σ2 unknown, n1 or n2 < 30 x * Với sp = x2 1 n1 n n1 −1 s 21 + n2 −1 s 22 n1 +n2 −2 Kiểm định hiệu trung bình (mẫu lớn) Bài 7.7 : 50 sinh viên nam tỏ ham thích tham gia mơn điền kinh có chiều cao trung bình 175 cm độ lệch chuẩn hiệu chỉnh cm Trong 50 sinh viên nam khác tỏ không quan tâm đến mơn điền kinh có chiều cao trung bình 170 cm độ lệch chuẩn hiệu chỉnh cm a) Hãy kiểm định giả thiết sinh viên nam có ý thích tham gia vào mơn điền kinh cao sinh viên nam khác b) Giá trị P kiểm định bao nhiêu? 29-Nov-17 58 Kiểm định hiệu trung bình (mẫu lớn) Kích thước mẫu Trung bình mẫu Độ lệch chuẩn mẫu MẪU n1 = 50 175 𝑥1 = 𝑠ෝ1 = • Ta phải định giả thiết : MẪU n2 = 50 170 𝑥2 = 𝑠ෝ2 = 𝑯𝟎: 𝝁𝟏 − 𝝁𝟐 = 𝟎 𝒐𝒓 𝝁𝟏 = 𝝁𝟐 𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 > 𝟎 𝒐𝒓 𝝁𝟏 > 𝝁𝟐 • Đây tốn kiểm định phía (bên phải) • Với mức ý nghĩa 5% (ta tự cho) • Bài tốn mẫu lớn dùng PP chuẩn, giá trị tới hạn là: 𝒛𝒄 = 𝑵𝑶𝑹𝑴 𝑺 𝑰𝑵𝑽 𝟏 − 𝒂 = 𝟏 𝟔𝟓 Kiểm định hiệu trung bình (mẫu lớn) 𝒔ෞ𝟏 𝟐 𝒔ො 𝟐𝟐 + 𝒏𝟏 𝒏𝟐 𝝈𝑿𝟏−𝑿𝟐 = = 𝟔𝟐 𝟓𝟎 𝟕𝟐 + 𝟓𝟎 = 𝟏 𝟑038 Tính tốn giá trị kiểm định 𝐳= ഥ𝟏 −ഥ 𝒙 𝒙𝟐 𝝈 = 𝟏𝟕𝟓−𝟏𝟕𝟎 𝟏.𝟑𝟎𝟑𝟖 = 𝟑.83 𝒑𝒗𝒂𝒍𝒖𝒆 = 𝑷 𝒁 > 𝟑 𝟖𝟑 = 𝟎 𝟎𝟎𝟔𝟒% Reject H0 𝑯𝒐 𝜶 = 𝟎 𝟎𝟓 1.65 3.83 Bác bỏ H0 KL: Với mức ý nghĩa 5%, ta bác bỏ giả thiết 𝑯𝒐 ,tức chấp nhận giả thiết sinh viên nam có ý thích tham gia vào mơn điền kinh cao sinh viên nam khác Kiểm định hiệu trung bình (mẫu lớn) Bài 7.11 : Một mẫu gồm 100 bóng đèn điện xí nghiệp A sản xuất cho thấy tuổi thọ trung bình 1.190 độ lệch chuẩn 90 Một mẫu gồm 75 bóng đèn điện xí nghiệp B sản xuất cho thấy tuổi thọ trung bình 1.230 độ lệch chuẩn 120 Có khác biệt tuổi thọ trung bình hai nhãn hiệu bóng đèn với mức ý nghĩa: a) 0,05 b) 0,01 c) Tính giá trị P phép kiểm định Độ lệch chuẩn chuyển độ lệch chuẩn hiệu chỉnh 𝑠Ƹ = 𝐳= ഥ𝟏 −ഥ 𝒙 𝒙𝟐 𝟐 𝑠ො + 𝒔ො 𝟐 𝒏𝟏 𝒏𝟐 29-Nov-17 𝑛 𝑛−1 ×𝑠 = −𝟐 𝟒𝟏 𝑃𝑣𝑎𝑙𝑢𝑒 = 1.61% 61 Kiểm định hiệu trung bình (mẫu nhỏ) • • • • • • Để kiểm định tính hiệu loại phân bón việc sản xuất lúa mì, vùng đất chia thành 56 hình vng có diện tích nhau, tất phần chia có chất lượng đất, ánh nắng, nước tưới Loại phân bón bón cho 28 28 cịn lại bón phân bón cũ Năng suất thu hoạch trung bình dùng phân bón 18,2 giạ/ độ lệch chuẩn hiệu chỉnh 0,63 giạ/thửa Năng suất thu hoạch trung bình độ lệch chuẩn hiệu chỉnh dùng phân bón cũ 17,8 giạ/ 0,54 giạ/thửa Giả sử suất loại phân bón tuân theo quy luật phân phối chuẩn có phương sai Hãy kiểm định giả thiết loại phân bón tốt loại phân bón cũ ĐS: 𝐬𝒑 = 𝟎 𝟓𝟖𝟔𝟕 , 𝒕 = 𝟐 𝟓𝟓𝟎𝟖, 𝒑𝒗𝒂𝒍𝒖𝒆 = 𝟎 𝟔𝟖% 29-Nov-17 62 Kiểm định hiệu trung bình (mẫu nhỏ) • Một viện dưỡng lão làm thí nghiệm sau: chọn ngẫu nhiên 30 người già viện, chia làm nhóm, nhóm 15 người Cho người cảnh Yêu cầu người nhóm ngày chăm sóc cây, cịn khơng u cầu người nhóm cịn lại chăm sóc • Người ta ghi nhận lại số lần than phiền sức khỏe người nhóm vịng tháng sau cho cây, kết có sau: • Nhóm (được u cầu chăm sóc cây): 23, 12, 6, 15, 18, 5, 21, 18, 34, 10, 23, 14, 19, 23, • Nhóm (khơng u cầu chăm sóc cây): 35, 21, 24, 26, 17, 23, 37, 22, 16, 38, 23, 41, 27, 24, 32 • Giả sử số lần than phiền sức khỏe nhóm có phân phối chuẩn có phương sai • Theo bạn, việc chăm sóc có giúp làm giảm số lần than phiền sức khỏe người già hay không? ĐS: 𝒔𝒑 = 𝟕 𝟕𝟔𝟓𝟓; 𝒕 = −𝟑 𝟔𝟗; 𝑷𝒗𝒂𝒍𝒖𝒆 = 𝟎 𝟎𝟒𝟖% 29-Nov-17 63 Kiểm định hiệu tỷ lệ • Xét mẫu độc lập lấy từ tổng thể khác • Tỷ lệ tổng thể 𝑝1 , 𝑝2 (khơng biết) • Tỷ lệ mẫu 𝑓1 , 𝑓2 Kiểm định bên trái Kiểm định bên phải Kiểm định hai phía H0: p1 p2 H1: p1 < p2 H0: p1 ≤ p2 H1: p1 > p2 H0: p1 = p2 H1: p1 ≠ p2 Hoặc Hoặc Hoặc H0: p1 – p2 H1: p1 – p2 < H0: p1 – p2 ≤ H1: p1 – p2 > H0: p1 – p2 = H1: p1 – p2 ≠ Kiểm định hiệu tỷ lệ • mẫu độc lập • 𝑛1 𝑣à 𝑛2 ≥ 30 • Tỷ lệ mãu 𝑓1 𝑣à 𝑓2 tính Ta sử dụng PP chuẩn 𝒛 = Với: 𝒇𝟏 − 𝒇𝟐 𝟏 𝟏 𝒇 (𝟏 − 𝒇) + 𝒏𝟏 𝒏𝟐 𝒇= 𝒏𝟏 𝒇𝟏 +𝒏𝟐 𝒇𝟐 𝒏𝟏 +𝒏𝟐 Kiểm định hiệu tỷ lệ Ví dụ : Chọn mãu ngẫu nhiên gồm 160 sản phẩm máy A sản xt thấy có 16 sản phẩm bị hỏng chọn mãu ngẫu nhiên gồm 90 sản phẩm máy b sản xt thấy có sản phẩm bị hỏng Hãy kiểm định giả thiết : chất lượng sản phẩm máy B không khác chất lượng sản phẩm máy A Tính giá trị P phép kiểm định 𝑧= 𝑓1 − 𝑓2 𝑓 1−𝑓 1 + 𝑛1 𝑛2 = 1.216 Với 𝑓 = 𝑓1 𝑛1 +𝑓2 𝑛2 𝑛1 +𝑛2 = 0.084 Với 𝑧𝑐 = 1.96 Giá trị P kiểm định phía = 22.4% 29-Nov-17 66 Kiểm định hiệu tỷ lệ Bài 7.14: Chọn mẫu ngẫu nhiên gồm 200 sản phẩm máy A sản xuất thấy có 19 sản phẩm bị hỏng chọn mẫu ngẫu nhiên gồm 100 sản phẩm máy B sản xuất thấy có sản phẩm bị hỏng Sử dụng mức ý nghĩa 0,05 Hãy kiểm định giả thiết: a) Chất lượng sản phẩm hai máy sản xuất khác Tính giá trị P phép kiểm định b) Chất lượng sản phẩm máy B tốt máy A Tính giá trị P phép kiểm định 29-Nov-17 67 Bài tập tổng hợp 7.37 Khảo sát doanh số bán siêu thị số ngày chọn ngẫu nhiên, ta thu số liệu sau: a) Hãy ước lượng doanh số bán trung bình siêu thị ngày với độ tin cậy 95% b) Những ngày có doanh số bán 130 triệu đồng gọi ngày đắt hàng Hãy ước lượng tỷ lệ ngày đắt hàng siêu thị với độ tin cậy 99% c) Trước doanh số bán trung bình ngày 100 triệu đồng, siêu thị áp dụng phương thức thay đổi cách tiếp thị thái độ phục vụ khách hàng Với mức ý nghĩa 1%, xét xem phương thức có thật làm tăng doanh số bán siêu thị không? d) Ban giám đốc siêu thị cho biết với phương thức doanh số bán trung bình ngày 120 triệu đồng Với mức ý nghĩa 5%, xét xem nguồn tin từ Ban giám đốc có hợp lý khơng? Tính giá trị P phép kiểm định 29-Nov-17 Doanh số (triệu đồng) 50 - 70 Số ngày 70 - 90 30 90 - 110 40 110 - 130 25 130 - 150 20 150 - 200 15 10 68 Bài tập tổng hợp 7.40 Một công ty xuất muốn mua bè cá basa nên khảo sát lấy mẫu ngẫu nhiên bè cá, số liệu thống kê trọng lượng thu mẫu sau: a) Với độ tin cậy 95%, ước lượng tổng trọng lượng cá bè Biết bè chứa 10 ngàn b) Biết cá đạt tiêu chuẩn xuất cá có trọng lượng lớn hay 1,1 kg Chủ bè cá cho tỷ lệ cá đạt tiêu chuẩn xuất 90% Với mức ý nghĩa 5%, kiểm tra xem báo cáo chủ bè cá có đáng tin cậy khơng Tính giá trị P phép kiểm định c) Cũng bè cá vào mùa trước, sau mua cân đo thực tế cơng ty có ghi nhận trọng lượng trung bình cá 1.18 kg Mùa này, bè cá thay đổi phương pháp nuôi dưỡng cho cá, với mức ý nghĩa 5%, kiểm tra xem phương pháp nuôi dưỡng có thực hiệu để tăng trọng lượng cá bè hay không? 29-Nov-17 Trọng lượng (đơn vị kg) 0,8 0,9 Số 10 0,9 1,0 16 1,0 1,1 20 1,1 1,2 40 1,2 1,3 40 1,3 1,4 80 1,4 1,6 50 69