Bài toán kiểm định giả thiết H0: p= p0 và đối thiết H1 (hoặc H ngang, hoặc Ha) gọi là bài toán kiểm định tỷ lệ. Ta sẽ xét bài toán kiểm định giả thiết tỷ lệ số lần thành công trong phép thử nhị thức bằng giá trị cụ thể nào đó.
Tiến sỹ: Nguyễn Hữu Thọ Bài giảng Môn Toán 5- Xác suất Thống kê 2011 -2 012 Bài số 12 KIỂM ĐNNH GIẢ THIẾT VỀ TỶ LỆ I KIỂM ĐNNH MỘT TỶ LỆ 1.Khái niệm Giả sử tổng thể có hai loại phần tử: có tính chất ℑ tính chất ℑ , tỷ lệ phần tử có tính chất ℑ p0 chưa biết Bài toán kiểm định giả thiết: H : p = p0 với đối thiết H gọi toán kiểm định tỷ lệ Ta xét toán kiểm định giả thuyết tỷ lệ số lần thành công phép thử nhị thức giá trị cụ thể Tức là, ta kiểm định giả thuyết H : p = p0 với p tham số phân phối nhị thức Đối thuyết phía hai phía: p < p0 , p > p0 p ≠ p0 Biến ngẫu nhiên thích hợp mà ta dựa vào để kiểm định biến ngẫu nhiên nhị thức X Vì X biến ngẫu nhiên nhị thức rời rạc, nên không miền bác bỏ xây dựng với cỡ xác giá trị α cho trước 1.Đối với mẫu cỡ nhỏ a Để kiểm định: H : p = p0 , H : p < p0 , ta sử dụng phân phối nhị thức để tính: P = P (X ≤ x p = p0 ) Giá trị x số lần thành công mẫu cỡ n : Nếu P ≤ α , toán có mức ý nghĩa α ta bác bỏ H , chấp nhận H b Để kiểm định: H : p = p0 , H : p > p0 , mức ý nghĩa α , ta tính: P = P (X ≥ x p = p0 ) Khi ta bác bỏ H (chấp nhận H ) P ≤ α c Để kiểm định: H : p = p0 , H : p ≠ p0 , mức ý nghĩa α , ta tính: P = 2P (X ≤ x p = p0 ) x < np0 P = 2P (X ≥ x p = p0 ) x > np0 Khi ta bác bỏ H (chấp nhận H ) P ≤ α Tiến sỹ: Nguyễn Hữu Thọ Bài giảng Môn Toán 5- Xác suất Thống kê 2011 -2 012 Các bước kiểm định giả thuyết tỷ lệ với đối thuyết khác sử dụng xác suất nhị thức cho Bảng A.1, tiến hành sau: H : p = p0 H : p < p0, p > p0 p ≠ p0 Chọn mức ý nghĩa α Thống kê tiêu chuNn: Biến ngẫu nhiên nhị thức X với p = p0 Tính toán: Tìm x số lần thành công, tính giá trị P thích hợp Kết luận: Đưa kết luận phù hợp dựa vào giá trị P Ví dụ Một nhà xây dựng khẳng định, máy bơm nhiệt (dùng để sưởi ấm, làm mát tòa nhà) lắp đặt 70% số hộ xây dựng công ty Richmond Có thể đồng ý với khẳng định không điều tra ngẫu nhiên cho thấy, 15 nhà lắp máy bơm nhiệt? Dùng mức ý nghĩa 0,1 Giải Gọi p tỷ lệ hộ lắp bơm nhiệt Xét toán kiểm định giả thiết : H : p = p0 với đối thiết H : p ≠ 0, Ta có: + mức ý nghĩa: α = 0,1 + Tiêu chuNn kiểm định giả thiêt: Biến ngẫu nhiên nhị thức X với p = 0, n = 15 + Tính toán: x = np0 = 15.0, = 10, , suy x < np0 Do đó, từ Bảng A.1, ta tính được: P = 2P (X ≤ p = p0 ) = 2∑ b(x ;15; 0, 7) = 0,2622 > 0,1 x =0 Kết luận: Không bác bỏ H : tức ta không đủ chứng để nghi ngờ nhà xây dựng Đối với mẫu cỡ lớn Với n lớn, ta cần dùng phương pháp xấp xỉ Khi giá trị giả thuyết p0 gần 1, ta sử dụng phân phối Poisson với tham số µ = np0 Tuy nhiên, xấp xỉ phân phối chuNn với tham số µ = np0 σ = np0q thường sử dụng nhiều cho trường hợp n lớn xác p0 không gần Nếu ta dùng xấp xỉ phân phối chuNn tắc để kiểm định p = p0 cho bởi: Tiến sỹ: Nguyễn Hữu Thọ Bài giảng Môn Toán 5- Xác suất Thống kê z= x − np0 np0q giá trị biến ngẫu nhiên chuNn chuNn hóa Z = 2011 -2 012 , q = − p0 X − np0 np0q Khi đó: a Đối với toán kiểm định hai phía: H : p = p0 H : p ≠ p0 mức ý nghĩa α , miền bác bỏ là: (−∞; −z α/2 ) ∪ (z α/2 ; +∞) z α xác định bởi: P (Z > z α ) = α b Đối với toán kiểm định phía: H : p = p0 H : p < p0 mức ý nghĩa α , miền bác bỏ (−∞; −z α ) z α xác định bởi: P (Z > z α ) = α c Đối với toán kiểm định phía: H : p = p0 , H : p > p0 mức ý nghĩa α , miền bác bỏ (z α ; +∞) z α xác định bởi: P (Z > z α ) = α Ví dụ Một loại thuốc an thần thường dùng tin có tác động tới 60 % người sử dụng Kết thử nghiệm loại thuốc 100 người trưởng thành cho thấy 70 người nhận tác dụng Có thể tin hay không loại thuốc tốt loại thường dùng? Sử dụng mức ý nghĩa 0, 05 Giải: Gọi p tỷ lệ người chịu tác động loại thuốc Xét toán kiểm định giả thiết: H : p = 0, với đối thiết H : p > 0, Tại mức ý nghĩa: α =0,05 ta có: Tiến sỹ: Nguyễn Hữu Thọ Bài giảng Môn Toán 5- Xác suất Thống kê 2011 -2 012 + Miền bác bỏ: (z 0,05 ; +∞) z 0,05 xác định bởi: P (Z > z 0,05 ) = 0, 05 , tra bảng A3 ta z 0,05 = 1, 645 Nên miền bác bỏ: (1, 645; +∞) + Tiêu chuNn kiểm định giả thiết: Z = X − np0 np0q Tính toán: x = 70 ; n = 100 ; np0 = 100.0, = 60 và: z= 70 − 60 = 2, 04 > 1, 645 100.0, 6.0, + Kết luận: Bác bỏ H , tức loại thuốc tốt II KIỂM ĐNNH HAI TỶ LỆ Xét toán kiểm định giả thuyết rằng: hai tỷ lệ hai tham số nhị thức Tức ta muốn kiểm định giả thuyết H : p1 = p2 với đối thuyết p1 < p2 , p1 > p2 p1 ≠ p2 Điều tương đương với giả thuyết H : p1 − p2 = đối thuyết p1 − p2 < , p1 − p2 > p1 − p2 ≠ Thống kê mà ta dựa vào để kiểm định biến ngẫu nhiên Pˆ1 − Pˆ2 Các mẫu độc lập cỡ n1, n2 chọn ngẫu nhiên từ hai phân phối nhị thức tỷ lệ thành công Pˆ , Pˆ cho hai mẫu tính toán Trong xây dựng khoảng tin cậy cho p1, p2 , ta ý rằng, với n1, n2 đủ lớn, ước lượng điểm Pˆ1 − Pˆ2 xấp xỉ phân phối chuNn với trung bình: µPˆ −Pˆ = p1 − p2 phương sai σP2ˆ −Pˆ = 2 p1q1 n1 + p2q n2 Do đó, miền chấp nhận tiêu chuNn thành lập dựa vào biến ngẫu nhiên chuNn chuNn hóa: Z = (Pˆ1 − Pˆ2 ) − (p1 − p2 ) (p1q1 / n1 ) + (p2q / n2 ) Khi H đúng, ta đặt p1 = p2 = p q1 = q2 = q công thức trở thành: Tiến sỹ: Nguyễn Hữu Thọ Bài giảng Môn Toán 5- Xác suất Thống kê Pˆ1 − Pˆ2 Z= 2011 -2 012 pq[(1 / n1 ) + (1 / n2 )] Để tính Z, ta phải ước lượng tham số p q dấu Gộp chung liệu từ hai mẫu, ước lượng gộp chung cho tỷ lệ p là: pˆ = x1 + x n1 + n , với x 1, x số lần thành công mẫu Thay pˆ cho p qˆ = − pˆ cho q , giá trị z để kiểm định p1 = p2 xác định qua công thức: pˆ1 − pˆ2 z= ˆˆ[(1 / n1 ) + (1 / n2 )] pq Khi miền bác bỏ: + Với đối thuyết p1 ≠ p2 mức ý nghĩa α , miền bác bỏ (−∞; −z α/2 ) ∪ (z α/2 ; +∞) + Với đối thuyết p1 < p2 , miền bác bỏ (−∞; −z α ) + Với đối thuyết p1 > p2 , miền bác bỏ (z α ; +∞) Ví dụ Một bỏ phiếu đưa để xác định vị trí xây dựng nhà máy hóa chất trị trấn hay ngoại vi thị trấn Có 120 200 cử tri thị trấn đồng ý xây dựng nhà máy thị trấn 240 500 cử tri ngoại vi đồng ý với đề xuất Liệu cho tỷ lệ cử tri thị trấn đồng ý với đề xuất lớn tỷ lệ cử tri ngoại vi đồng ý hay không? Sử dụng mức ý nghĩa 0,025 Giải: Gọi p1, p2 tương ứng tỷ lệ cử tri thị trấn ngoại vi đồng ý với đề xuất H : p1 = p2 Ta xét toán kiểm định: H : p1 > p2 Với mức ý nghĩa: Tính toán với: α =0,025, ta có miền bác bỏ là: (2, 24; +∞) : pˆ1 = pˆ = Do đó: z= x1 n1 = x1 + x n1 + n2 120 = 0, 200 = pˆ2 = x2 n2 = 240 = 0, 48 500 120 + 240 = 0, 51 200 + 500 0, − 0, 48 = 2, > 2,24 0, 51.0, 49.[(1 / 200) + (1 / 500)] Tiến sỹ: Nguyễn Hữu Thọ Bài giảng Môn Toán 5- Xác suất Thống kê 2011 -2 012 Kết luận: Bác bỏ H , chấp nhận tỷ lệ cử tri thị trấn đồng ý với đề xuất lớn tỷ lệ cử tri ngoại vi đồng ý Về nhà: Tự đọc: Mục 10.14; 10.15; 10.16 10.17 Bài tập: Tr 360; 364; 376 Đọc trước Mục từ 11.1 đến 11.3 chuNn bị cho Bài số 13 : Hồi quy tuyến tính đơn