Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 18 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
18
Dung lượng
760 KB
Nội dung
Chương6 KIỂM ĐỊNH GIẢ THUYẾT ( H ypothesis Testing) Đặt vấn đề: Một nhà SX túi chườm nóng dùng cho mùa đông tuyên bố rằng túi chườm nóng của công ty ông có tuổi thọ là 1000 lần sử dụng. Giải quyết vấn đề: Cần kiểm tra để đưa ra kết luận chấp nhận hay bác bỏ giả thuyết (lời tuyên bố trên). Các bước tiến hành: --Chọn mẫu n SP để tính tuổi thọ trung bình của số mẫu trên ( x ). --So sánh x với tuổi thọ của SP theo lời tuyên bố ( tính giá trị kiểm định Z, t, ). --Chấp nhận sai số α (mức ý nghĩa α) để từ đó xác định giá trị Z tới hạn :Z α hay Z α/2 (critical value) --So sánh giá trị kiểm định Z với Z α hay Z α/2 để kết luận chấp nhận hay bác bỏ giả thuyết trên (xác định Miền bác bỏ H 0 ). 1. KHÁI NIỆM: Kiểm định giả thiết ( giả thuyết ) là việc đưa ra kết luận chấp nhận hay bác bỏ 1 giả thiết cho trước. 1.1. Các loại kiểm định: Giả thiết H 0 và giả thiết đối H 1 (The Null and Alternative Hypothesis) -- giả thiết ( H 0 ) : tuổi thọ của SP (µ ) = 1000 lần SD. -- giả thiết đối ( H 1 , H A ) : tuổi thọ của SP (µ ) ≠ 1000 lần SD. Các loại kiểm định: * Kiểm định 2 bên : H 0 : µ = 1000 lần SD. (Two-tail test) H 1 : µ ≠ 1000 lần SD. * Kiểm định 1 bên : + Bên trái : H 0 : µ = 1000 lần SD. (µ ≥ 1000 lần SD) (One-tail test) H 1 : µ < 1000 lần SD. + Bên phải : H 0 : µ = 1000 lần SD. (µ ≤ 1000 lần SD) H 1 : µ > 1000 lần SD. Kiểm đònh bên trái kiểm đònh bên phải kiểm đònh hai bên → gọi là kiểm đònh một bên vì Miền bác bỏ nằm về một phía của miền chấp nhận 1.2. Sai lầm trong phương pháp kiểm định giả thiết : ( Risks in decision Making Using Hypothesis-Testing methodology) Điểm hạn chế trong thực hành kiểm định là chỉ quan sát trên một mẫu cụ thể, từ đó khả năng mắc sai lầm trong quyết định là dễ xảy ra. Người ta qui ước phân biệt 2 loại sai lầm sau: - Sai lầm loại I (type I error): bác bỏ H O khi giả thuyết này đúng. Khả năng (xác suất) mắc sai lầm loại 1 là α, đây cũng là mức ý nghĩa của phép kiểm định. Như vậy, xác suất chấp nhận giả thuyết là ( 1 - α ). - Sai lầm loại II (type II error): chấp nhận H O khi giả thuyết này sai. Xác suất mắc sai lầm loại 2 là β. Như vậy, xác suất bác bỏ giả thuyết là ( 1 - β ). Bảng tóm tắt những quyết đònh trên H O : 1.3.Các ký hiệu : Giả thuyết H o đúng Giả thuyết H o sai Bác bỏ H o Sai lầm loại 1: Xác suất α Xác suất quyết đònh đúng: ( 1 - α ) Chấp nhận H o Xác suất quyết đònh đúng: (1 - β ) Sai lầm loại 2: Xác suất β 1 - α 1 - α 1 - α α α α/2 α/2 z α z α z α/2 z α/2 Chỉ tiêu Tổng thể chung Tổng thể mẫu Giả thiết 1.Số đơn vị tổng thể 2.Các tham số của tổng thể: a.Số trung bình b.Tỉ lệ (prortion) c.Phương sai --Phương sai của STB --Phương sai của tỉ lệ N θ µ p σ 2 2 x σ 2 p σ 2 p σ = p (1- p) n θ’ x p ˆ S 2 2 x S 2 p S 2 p S = p ˆ (1- p ˆ ) θ 0 µ 0 p 0 2 0 σ 2 x0 σ 2 p0 σ 2 p0 σ = p 0 (1- p 0 ) 2. KIỂM ĐỊNH GIẢ THUYẾT VỀ SỐ TRUNG BÌNH, TỈ LỆ, PHƯƠNG SAI CỦA TỔNG THỂ. 2.1. Giá trò kiểm đònh: ( The value of the test statistic) 2.1.1. Kiểm định số trung bình, tỉ lệ. a. Trường hợp tổng thể có phân phối chuẩn, bi ế t σ 2 (tính Z) ( Z test of hypothesis) Cụ thể: ++ Khi kiểm định STB : ( Z test of hypothesis for the mean ) n x Z 2 x 0 σ µ − = ++Khi kiểm định tỉ lệ: n Z 2 0 σ θθ − ′ = = n σ 0 θθ − ′ ( Z test of hypothesis for the proportion) n Z 2 0p 0 σ pp ˆ − = = n pp )00 0 1( pp ˆ − − Ghi chú: 1.Kiểm đònh Z cũng áp dụng cho trường hợp tổng thể có phân phối chuẩn, n ≥ 30 + chưa biết σ 2 2.Khi khơng có tài liệu về phương sai của tổng thể chung, dùng phương sai mẫu (S 2 ) b. Trường hợp tổng thể có phân phối chuẩn , n < 30 + chưa biết σ 2 (tính t)( t test of hypothesis for the mean ( σ unknow) ) n t 2 0 s θθ − ′ = 2.1.2. Kiểm định phương sai . * Giả thuyết: H o : σ 2 = σ 0 2 H 1 : σ 2 ≠ σ 0 2 * Giá trò kiểm đònh: 2 2 2 )1( o sn σ χ − = 2.2. Miền bác bỏ và miền chấp nhận H 0 . ( Regions of Rejection and NonRejection) Bước 1: Chấp nhận Mức ý nghĩa ( α ) ( The Level of Singificance ( α ) ) Bước 2: Tra bảng tìm giá trò tới hạn Z, t, 2 χ (Z, t, 2 χ critical) a. Kiểm đònh Z : tra bảng phân phối chuẩn : - Kiểm định 2 bên: tìm Z α/2 - Kiểm định 1 bên: tìm Z α. b. Ki ể m định t : tra bảng T-Student - Kiểm định 2 bên: tìm t n-1, α/2 - Kiểm định 1 bên: tìm t n-1, α c. Kieåm ñònh phöông sai : tra bảng phaân phoái 2 χ : tìm 2 2/,1 α χ − n hay 2 2/1,1 α χ −− n Böôùc 3: Xác định miền bác bỏ và miền chấp nhận H 0 : a. Kieåm ñònh Z & ki ểm định t : Loại kiểm định Bác bỏ H 0 khi : Chấp nhận H 0 khi : 1.K Đ 2 bên : a.kieåm ñònh Z b.kiểm định t │Z │ ≥ Z α │t │ ≥ t n-1, α * nếu x < µ 0 → µ < µ 0 │Z │ < Z α │t│ < t n-1, α 1.K Đ 1 bên : a.kieåm ñònh Z b.kiểm định t │Z │ < Z α /2 │t │ < t n-1, α/2 │Z │ < Z α /2 │t │ < t n-1, α/2 c. Kiểm đònh Ph ương sai : Áp d ụ ng : Cơng ty Mai Hòa chun sản xuất bơng gòn, để kiểm tra xem máy có làm việc bình thường hay khơng người ta tiến hành cân thử một số thành phẩm là bao bông gòn y tế loại 50gr và thu được kết quả như sau: (đơn vị: gram) 50; 51; 52; 54; 49; 38; 50; 51; 55; 37; 49; 52; 56; 52; 49; 36; 49; 38; 49; 53; 51; 50; 50; 52; 35; 46; 48; 49; 53; 47; 51; 53; 48; 53; 55; 49. Trọng lượng thiết kế của sản phẩm là 50 gr. Vậy với mức ý nghĩa 5%, có thể kết luận hệ thống máy sản xuất ổn định khơng ? Giải: **Giả thuyết: H 0 : µ = 50gr. H 1 : µ ≠ 50gr. **Giá trị kiểm định: Z = n x σ µ 0 − = 36 43,5 5089,48 − = - 0,034 Với: + x = 48,89gr. + x S = 5,43gr. + µ 0 = 50gr. + n = 36 * 2 2/1,1 2 α χχ −− < n hay 2 2/,1 2 α χχ − > n * 2 2/,1 22 2/1,1 αα χχχ −−− << nn Bác bỏ H 0. → Chấp nhận H 1. Chấp nhận H 0. + nếu 22 o s σ > → σ 2 > σ 0 2 + nếu 22 o s σ < → σ 2 < σ 0 2 **Xác định mi ề n bácb ỏ hay ch ấ p nh ậ n H 0 : │Z│ = 0,034 < Z α/2 = Z 0,025 =1,96 → Chấp nhận H 0 (µ = 50gr). **Kết luận: Với mức ý nghóa 5%, có thể kết luận rằng trọng lượng trung bình 1 bao bông gòn trên là 50gr, đúng trọng lượng thiết kế của SP. Như vậy, hệ thống máy sản xuất ổn đònh. 2.3. Giá trò P (The p – Value Approch ) ( The Probability value) 2.3.1. Khái niệm: Giá trò p là mức ý nghóa α nhỏ nhất mà tại đó giả thuyết H 0 bắt đầu bò bác bỏ. 2.3.2.Phương pháp xác đònh: a. Kiểm đònh 1 bên: TD: nếu kiểm đònh 1 bên, Z = 2 , Bác bỏ H 0 khi : │Z │ = 2 ≥ Z α Z α ≤ 2 , mà p-value là α nhỏ nhất: Z α = 2 Tra Bảng , ta có: 1- α = 0,9772 → α = p- value = 1 – 0,9772 = 0,0228 = 2,28%. p- value = 2,28%. KL: Như vậy, với tình hình trên, khi kiểm định 1 bên ta bác bỏ H 0 với mọi mức ý nghĩa α ≥ 2,28% b. Kiểm đònh 2 bên: TD: nếu kiểm đònh 2 bên, Z = 2 , Bác bỏ H 0 khi : │Z │ = 2 ≥ Z α /2 → Z α/2 ≤ 2 , mà p-value là α nhỏ nhất: Z α /2 = 2 Tra Bảng , ta có: 1- α/2 = 0,9772 → α/2 = 1 – 0,9772 = 0,0228 = 2,28%. p- value = α = 4,56%. KL: Như vậy, với tình hình trên, khi kiểm định 2 bên ta bác bỏ H 0 tại mọi mức ý nghĩa α ≥ 4,56%. 2.3.3. K ế t lu ậ n k i ể m đ ị nh b ằ ng p-value. đ đ Như vậy, khi kiểm đònh với mức ý nghóa α đ ≥ p - value. Bác bỏ H 0 Ngược lại, khi kiểm đònh với mức ý nghóa α đ < p - value. Chấp nhận H 0 3. KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC NHAU GIỮA 2 SỐ TRUNG BÌNH CỦA 2 TỔNG THỂ. 3.1. Ki ểm định giả thuyết trong trường hợp mẫu phối hợp từng cặp. Giả sử ta có mẫu gồm n cặp quan sát ngẫu nhiên từ hai tổng thể X và Y: (x 1 ,y 1 ), (x 2 ,y 2 ),… , (x n ,y n ). Gọi : + µ x , µ y : trung bình của từng tổng thể. + d : trung bình của n khác biệt (x i – y i ). + s d : độ lệch tiêu chuẩn của n khác biệt (x i – y i ). Giả sử rằng các khác biệt giữa x và y trong tổng thể có phân phối chuẩn. **Giả thuyết: +KĐ 2 bên : H 0 : µ x - µ y = D 0 (D 0 là giá trị cho trước). H 1 : µ x - µ y ≠ D 0 +KĐ 1 bên : H 0 : µ x - µ y = D 0 (hoặc µ x - µ y ≥ D 0 ) H 1 : µ x - µ y < D 0 +KĐ 1 bên : H 0 : µ x - µ y = D 0 (hoặc µ x - µ y ≤ D 0 ) H 1 : µ x - µ y > D 0 **Giá trị kiểm định: n s Dd t d o − = **Chấp nhận mức ý nghĩa α → tra bảng T-Student tìm t n-1,α/2 hoặc t n-1, α **Xác định Mi ền bác bỏ hay miền chấp nhận H 0 Loại kiểm định Bác bỏ H 0 khi: Kiểm định 2 bên │t │ ≥ t n-1, α/2 Kiểm định 1 bên │t │ ≥ t n-1, α Áp dụng : Một công ty thực hiện các biện pháp tăng NSLĐ. Số liệu về năng suất lao động của 10 công nhân được thu thập trước và sau khi thực hiện các biện pháp tăng NSLĐ. STT của công nhân NSLĐ trước và sau khi thực hiện các biện pháp tăng NSLĐ Trước khi Sau khi 1 2 3 4 5 6 7 8 9 10 50 48 45 60 70 62 55 62 58 53 52 46 50 65 78 61 58 70 67 65 Quản đốc phân xưởng cho rằng không có sự khác nhau về NSLĐ trung bình trước và sau khi áp dụng biện pháp tăng NSLĐ.Với mức ý nghĩa 5% có thể kết luận gì về lời tuyên bố của quản đốc? Giải: **Gọi µ x , µ y là NSLĐ trung bình sau khi và trước khi thực hiện các biện pháp tăng NSLĐ **Giả thuyết : H 0 : µ x - µ y = D 0 H 1 : µ x - µ y ≠ D 0 **Giá trị kiểm định : Từ bảng trên ta tính được: + d i = 2, -2, 5, 5, 8, -1, 3, 8, 9, 12. + = 4,9 ; s d =4,4833; D 0 =0 → t = = 3,456 **Xác định miền bác bỏ và miền chấp nhận H 0 Ta có: │t │ = 3,456 > t n-1,α/2 = t 9,0,025 = 2,262 → Bác bỏ H 0 Chấp nhận H 1 (µ x - µ y ≠ D 0 ) Mà = 4,9 > D 0 = 0 µ x - µ y > 0 **K ết luận : Với mức ý nghĩa 5%, ta có thể kết luận rằng NSLĐ sau cải tiến cao hơn trước khi cải tiến. Như vậy, lời tuyên bố của quản đốc phân xưởng là sai. 3.2. Kiểm định trong trường hợp mẫu độc lập: Gọi : n x , n y là các đơn vị mẫu được chọn ngẫu nhiên độc lập từ hai tổng thể có phân phối chuẩn X và Y, có trung bình là µ x , µ y , phương sai là x 2 , y 2 , trung bình mẫu là x , y . **Giả thuyết : H 0 : µ x - µ y = D 0 H 1 : µ x - µ y ≠ D 0 **G iá trị kiểm định : [...]... 06. 9: Công ty SX xe gắn máy đang thử nghiệm một loại đđộng cơ mới cho xe của họ nhằm tiết kiệm nhiên liệu Công ty đã tiến hành thu thập Số km xe chạy tiêu hao 1 lít xăng trên các mẫu ngẫu nhiên theo từng loại xe tương ứng từng cặp động cơ cũ, mới Thông tin như sau : Đ/cơ cũ: 32, 36, 28 20, 32 20, 24, 36, 36, 40, 28, 34, 24, 40, 36, 32, 36, 20, 38, 40, 32 Đ/cơ mới: 40, 36, 36, 24, 36, 44, 44, 32, 36, ... sau khi được lấy máu là (với điều kiện máy móc, nhân sự hoạt động bình thường): STT bệnh nhân 1 2 Phút STT BN Phút 3 4 5 6 103 104 102 100 91 10 7 8 9 10 11 12 13 14 15 22 97 91 88 1 06 98 98 99 97 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 94 87 35 55 70 89 89 88 103 86 82 83 36 42 81 a Cho rằng thời gian trả kết quả xét nghiệm có phân phối chuẩn, với mức ý nghĩa 1% có đủ cơ sở kết luận thơng báo... Z Nếu → KĐ 1 bên Z ≥ Z α/2 ˆ px px > > ˆ py py < Zα BÀI TẬP 06. 1:Giám đốc XN Bình Minh báo cáo rằng lương trung bình của 1 công nhân trong XN là 1520000 đồng/tháng Chọn ngẫu nhiên 36 công nhân và thấy lương trung bình là 1400000 đồng/tháng với độ lệch chuẩn = 160 000 đồng Với mức ý nghóa α = 5%, lời báo cáo của giám đốc có tin cậy được hay không ? 06. 2: Nhóm nghiên cứu thuộc Nhà xuất bản BT đưa thông... 28 20, 32 20, 24, 36, 36, 40, 28, 34, 24, 40, 36, 32, 36, 20, 38, 40, 32 Đ/cơ mới: 40, 36, 36, 24, 36, 44, 44, 32, 36, 28, 36, 40, 32, 36, 40, 36, 48, 23, 40, 28, 40, Ở mức ý nghóa 2% có đủ cơ sở khẳng định động cơ mới có mức tiêu hao nhiên liệu thấp hơn động cơ cũ hay không ? 06. 10:Một tổ chức công tác xả hội muốn nghiên cúu xem tổng chi phí xây dựng 1 nhà tình nghóa, tình thương ở 2 khu vực trong... máy hay khơng? 06. 4: Kết quả thử nghiệm giống lúa mới trên 20 công ruộng (công =1000m2) cho năng suất 1 vụ như sau : Năng suất lúa (tạ/công) Diện tích gieo cấy (công) Dưới 3 1 3,8 dưới 4,0 4 3,0 dưới 3,4 8 3,4 dưới 3,8 4 4 trở lên 3 Cộng 20 Trung tâm khuyến nông Sở Nông nghiệp cho rằng trên đất đai của tỉnh, giống mới sẽ cho NS 3 ,6 tạ/công Kiểm đònh giả thuyết trên với mức ý nghóa là 5% 06. 5: Bộ phận... phận kỹ thuật hay không? 06. 6:Ngành du lòch cung cấp thông tin rằng số ngày bình qn du khách lưu lại trong các khách sạn của Hồng Kơng là 3.4 đêm Một công ty du lịch muốn kiểm đònh thông tin trên nên đã chọn ngẫu nhiên 28 du khách cho thấy số đêm họ lưu lại tại các khách sạn của Hồng Kơng như sau: 5, 4, 3, 2, 1, 1, 5, 7, 8, 4, 3, 3, 2, 5, 7, 1, 3, 1, 1, 5, 3, 4, 2, 2, 2, 6, 1, 7 Với mức ý nghĩa 0.05;... lượng thời gian trung bình trả kết quả xét nghiệm của trung tâm trên với độ tin cậy 95% 06. 3: Để ra quyết đinh có nên đặt một máy fax trong văn phòng hay khơng, người phụ trách muốn ước lượng nhu cầu số trang chuyển fax bình qn mỗi ngày Ơng cho ghi nhận lại nhu cầu này trong 15 ngày , tính được trung bình mẫu là 267 trang và theo kinh nghiệm của một số văn phòng khác thì độ lệch chuẩn là 32 trang Giả... khu vực trong nước là Nam trung bộ và Đồng bằng sông Cửu Long có thật sự khác nhau không.Dữ liệu thu thập được như sau (triệu đ/căn nhà) : NTB 29 27 24 30 28 22 32 26 ĐBSCL 23 22 32 25 29 24 27 31 Với mức ý nghĩa 0,05 hãy rút ra kết luận 30 26 ... vẽ Để kiểm đònh giả thuyết trên, người ta phỏng vấn 225 học sinh cấp II thu được tỉ lệ mẫu là 90% Với mức ý nghĩa 5%, có thể kết luận tỉ lệ này trong thực tế cao hơn thơng tin của nhà xuất bản khơng? 06. 2 Trung tâm chẩn đốn y khoa CD thơng báo trên phiếu hẹn với khách hàng là thời gian trả kết quả xét nghiệm là 120 phút sau khi trung tâm nhận mẫu xét nghiệm của khách hàng Để kiểm định, người ta chọn... khách sạn của Hồng Kơng như sau: 5, 4, 3, 2, 1, 1, 5, 7, 8, 4, 3, 3, 2, 5, 7, 1, 3, 1, 1, 5, 3, 4, 2, 2, 2, 6, 1, 7 Với mức ý nghĩa 0.05; thông tin trên của ngành du lòch có đáng tin cậy được không ? 06. 7: Nhân viên bán vé và tài xế một công ty vận chuyển hành khách chất lượng cao cho rằng 32% số chỗ trống trong các chuyến xe Phòng kinh doanh cơng ty muốn kiểm định liệu nhận định này có đúng khơng Họ . 36, 28. 20, 32. 20, 24, 36, 36, 40, 28, 34, 24, 40, 36, 32, 36, 20, 38, 40, 32 Đ/cơ mới: 40, 36, 36, 24, 36, 44, 44, 32, 36, 28, 36, 40, 32, 36, 40, 36, . pháp tăng NSLĐ Trước khi Sau khi 1 2 3 4 5 6 7 8 9 10 50 48 45 60 70 62 55 62 58 53 52 46 50 65 78 61 58 70 67 65 Quản đốc phân xưởng cho rằng không có sự