Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 37 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
37
Dung lượng
1,37 MB
Nội dung
Chương Kiểm định giả thiết 5.1 Khái niệm - Kiểm định giả thiết toán quan trọng đời sống thống kê toán H0 - Giả thiết thống kê giả thiết nói về: + tham số đặc trưng θ (tỷ lệ, trung bình, phương sai) + luật ppxs - Bài toán dựa số liệu mẫu tổng quát (X1 ,X , , X n ) để rút kết luận nên chấp nhận hay bác bỏ H , gọi toán kiểm định giả thiết thống kê VD 5.1: Khi ta cảm thấy mệt mỏi, ta nghi “mình bị bệnh”- giả thiết H việc khám bệnh để xem giả thiết hay không việc kiểm định giả thiết - Khi làm kiểm định, ta mắc phải sai lầm sau: + sai lầm loại I: H mà ta bác bỏ + sai lầm loại II: H sai mà ta chấp nhận - Tất nhiên kiểm định giả thiết, ta cần giảm thiểu tối đa xác suất phạm hai sai lầm, điều mà thực tế làm được, xs phạm sai lầm loại I giảm xs phạm sai lầm loại II tăng ngược lại - Nguyên tắc chung kiểm định giả thiết thống kê dựa nguyên lý xs nhỏ: biến cố có xs ≤ α nhỏ xem không xảy thực phép thử tương ứng VD 5.2: Khi đưa cho bạn biết ảnh người thành phố đông dân gần chắn bạn gặp người - Quy ước: sai lầm loại I tai hại cần tránh trước Vì vậy, với xs nhỏ α cho trước, ta cần định cho: ≤α P(saiHlầm I)=P(bác / Hloại bỏ đúng) α gọi mức ý nghĩa kiểm định ta thường chọn α 1%, 2%, 5% 5.2 Kiểm định tham số đặc trưng đám đông 5.2.1 Kiểm định giả thiết tỷ lệ đám đông Bài toán: Giả sử tỷ lệ đám đông p chưa biết Với mức ý nghĩa α, kiểm định giả thiết H : p = p0 với p0 biết Quy tắc thực hành: mẫu cụ thể (x1 , x , , x n ) f n − p0 m * tính f n = , t = n p0 (1 − p0 ) n − α baûng B *α⇒ → t α Nếu t ≤ t α : chấp nhận H Nếu t > t α : bác bỏ H Chú ý: bác bỏ H 0, xét tiếp p > p0 , f n > p0 , ta kết luận - < pluận f n t αn1 + n2 −2 : bác bỏ H Chú ý: bác bỏ H 0, xét tiếp - x n1 > y n2 ta kết luận µ1 > µ - x n1 < y n2 ta kết luận µ1 < µ VD 5.8: Gọi X, Y trọng lượng sản phẩm nhà máy I, II sản xuất Biết X, Y có phân phối chuẩn phương sai Đo trọng lượng 10 sản phẩm nhà máy I 15 sản phẩm nhà máy II, thu kết x n1 = 50,18kg, y n2 = 50kg, s1 = 1, s = Với mức ý nghĩa 1%, xem trọng lượng trung bình sản phẩm nhà máy I, II có không? VD 5.9: Theo tài liệu viện phát triển gia cầm hai giống gà G1 G 2có trọng lượng trung bình tháng tuổi Ta nuôi thử giống 100 gà tháng tuổi, cân thử ta tính x n1 = 1825g s1 = 1628 y n2 = 1973g s2 = 1876 Hãy vào mẫu đó, cho nhận xét tài liệu với mức ý nghĩa 1% * Bài tập: 28, 29, 30 sách Bài tập trang 107108 5.2.6 So sánh hai phương sai (giáo trình trang 168.) 5.3 Kiểm định giả thiết phân phối đám đông 5.3.1 Tiêu chuẩn phù hợp χ Bài toán: Giả sử đám đông X có hàm phân phối FX (x) chưa biết Với mức ý nghĩa α, từ mẫu cụ thể (x1 , x , , x n ), kiểm định giả thiết H : FX (x) = F (x) * * với F (x) hàm phân phối biết (pp chuẩn, nhị thức, Poisson…) Bài toán gọi toán kiểm định phù hợp Quy tắc thực hành: * Từ mẫu(xcụ thể 1, x , , x n ), n ³ 50 lập phân phối thực nghiệm X ni x1 n1 x x k n n k n1 + n + + n k = n, ni ≥ * Khi H đúng, tính X rời rạc P[X = x i ] pi = P[x i < X < x i +1 ] X liên tục, chọn x1 = −∞, x k = +∞ k (n i − npi ) χ =∑ npi i =1 baûng D * α → χ k − r −1 (1 − α) r số tham số luật pp cần kiểm định χ2 ≤ χ2k − r −1 (1 − α) : Nếu χ2 > χ (1 − α) : chấp nhận H0 k − r −1 H0 VD 5.10: Đo độ nhạy X kênh truyền hình 50 máy thu hình, ta kết Khoảng µV Số máy n i 75-125 125-175 175-225 225-275 275-325 325-375 Khoảng µV Số máy n i 375-425 425-475 475-525 525-575 575-625 625-675 Hãy kiểm định X có pp chuẩn với mức ý nghĩa 5% VD 5.11: giáo trình trang 173 * Bài tập: 33, 34, 35 sách Bài tập trang 110112 5.3.2 Kiểm tra độc lập Bài toán: Một mẫu hai ĐLNN X Y có bảng pp thực nghiệm Ta cần kiểm định giả Y y y k mx x1 n11 n12 n1k x n 21 n 22 n 2k m1 M xl nl n l n l k ny n1 n n l M ml n X y1 m2 thiết H :“X Y độc lập với nhau” với mức ý nghĩa α Quy tắc thực hành k l * Tính χ = ∑∑ (n ij − v ij ) j=1 i =1 baûng D * α → χ ( l −1)(k −1) v ij với v ij = (1 − α) 2 χ ≤ χ Nếu ( l −1)( k −1) (1 − α) : chấp nhận H 2 χ > χ Nếu ( l −1)( k −1) (1 − α) : bác bỏ H mi n j n VD 5.12: Quan sát tính tốt xấu 100 sản phẩm sản xuất ca I, II, III nhà máy, ta kết Ca Chất lượng tốt xấu I II III 25 32 28 Với mức ý nghĩa 5% xem chất lượng sản phẩm không phụ thuộc vào ca sản xuất hay không? 5.3.3 So sánh nhiều tỷ lệ Giả sử p=P(A) tỷ lệ đó, p1 , p , , p n n giá trị p tương ứng n tập Ta kiểm định giả thiết H : p1 = p = = p n mức ý nghĩa α Thực chất lời giải so sánh nhiều tỷ lệ trường hợp riêng kiểm định tính độc lập, lẽ hai dấu hiệu độc lập với tập điều có nghĩa tỷ lệ xét tập nhau, dấu hiệu A phụ thuộc vào tập tỷ lệ không nư VD 5.13: Để xác định thời vụ phun thuốc diệt sâu có lợi nhất, tổ bảo vệ trồng theo dõi lứa sâu tháng đếm số sâu non nở bắt Kết sau Tháng Tháng Tháng Tháng Tháng Số sâu non nở 62 28 70 75 15 Tổng số sâu bắt 488 392 280 515 185 Tỷ lệ sâu non nở tháng có khác (với mức ý nghĩa 5%)? Gọi p tỷ lệ sâu non nở tháng Giả thiết H : p1 = p = p3 = p = p5 Tính 2 n ij 2 χ = 1860 ∑∑ − 1÷ = 50 > χ (0,95) = 9,488 i=1 j=1 n i n j Bác bỏ giả thiết * Bài tập: 37-38 trang 114