Chương 5 Kiểm định giả thuyết Lê Xuân Lý (1) Viện Toán ứng dụng và Tin học, ĐHBK Hà Nội Hà Nội, tháng 9 năm 2018 (1)Email lexuanly@gmail com Lê Xuân Lý (SAMI HUST) Thống kê Kiểm định giả thuyết 1/34Hà[.]
Chương 5: Kiểm định giả thuyết Lê Xuân Lý (1) Viện Toán ứng dụng Tin học, ĐHBK Hà Nội Hà Nội, tháng năm 2018 (1) Email: lexuanly@gmail.com Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Kiểm định giả thuyết mẫu Hà Nội, 1/34 tháng năm 2018 / 34 Kiểm định cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng Giả thuyết thống kê: Trong nhiều lĩnh vực đời sống kinh tế xã hội, thường nêu nhận xét khác đối tượng quan tâm Những nhận xét sai Vấn đề kiểm tra tính sai nhận xét gọi kiểm định Kiểm định giả thuyết tốn xác định có nên chấp nhận hay bác bỏ khẳng định giá trị tham số tổng thể Bài toán Cho biến ngẫu nhiên X có EX = µ, V X = σ Mẫu cụ thể X (x1 , x2 , , xn ) Chú ý: cỡ mẫu n ≤ 30 ta phải thêm điều kiện X ∼ N (µ, σ ) Bài tốn đặt ta cần so sánh giá trị kỳ vọng µ với số µ0 cho trước Giả thuyết H0 Đối thuyết H1 µ = µ0 µ 6= µ0 µ ≤ µ0 µ > µ0 µ ≥ µ0 µ < µ0 Tuy nhiên giả thuyết ln có dấu "=" nên người ta cần viết giả thuyết H : µ = µ0 Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Hà Nội, 3/34 tháng năm 2018 / 34 Kiểm định giả thuyết mẫu Kiểm định cho kỳ vọng Kiểm định giả thuyết mẫu Cách giải Từ số liệu cho x1 , x2 , , xn ta tính giá trị quan sát k Ta chia trục số thành phần, phần Wα +) Nếu X ∈ Wα bác bỏ H0 chấp nhận H1 +) Nếu X ∈ / Wα ta khơng có sở bác bỏ H0 Sai lầm mắc phải Có loại sai lầm c ó thể mắc phải Sai lầm loại 1: Bác bỏ H0 H0 Xác suất xảy sai lầm loại 1: α = P (k ∈ Wα |H0 đúng) α gọi mức ý nghĩa Sai lầm loại 2: Chấp nhận H0 H0 sai Xác suất xảy sai lầm loại 2: β = P (k ∈ / Wα |H0 sai) Mục tiêu cực tiểu sai lầm, nhiên điều khó khăn Người ta chọn cách cố định sai lầm loại cực tiểu sai lầm loại Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Kiểm định giả thuyết mẫu Hà Nội, 4/34 tháng năm 2018 / 34 Kiểm định cho kỳ vọng Kiểm định giả thuyết mẫu Quan hệ thực tế định toán học Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Hà Nội, 5/34 tháng năm 2018 / 34 Kiểm định giả thuyết mẫu Kiểm định cho kỳ vọng Kiểm định giả thuyết mẫu Các bước làm kiểm định Bước 1: Gọi biến ngẫu nhiên, xây dựng cặp giả thuyết - đối thuyết Bước 2: Chọn tiêu chuẩn kiểm định Tính giá trị quan sát k Bước 3: Xác định miền bác bỏ H0 : Wα Bước 4: Kiểm tra xem giá trị quan sát k ∈ Wα hay không định Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Kiểm định giả thuyết mẫu Hà Nội, 6/34 tháng năm 2018 / 34 Kiểm định cho kỳ vọng Kiểm định cho kỳ vọng - σ biết Trường hợp 1: σ biết Chọn tiêu chuẩn kiểm định: Z = X − µ0 √ n ∼ N (0; 1) giả thuyết H0 σ Từ mẫu cụ thể (x1 , x2 , , xn ), ta tính giá trị quan sát: k = x − µ0 √ n σ Miền bác bỏ H0 xác định cho trường hợp sau: H0 H1 Miền bác bỏ H0 : Wα µ = µ0 µ 6= µ0 (−∞; −u1− α2 ) ∪ (u1− α2 ; +∞) µ = µ0 µ > µ0 (u1−α ; +∞) µ = µ0 µ < µ0 (−∞; −u1−α ) Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Hà Nội, 7/34 tháng năm 2018 / 34 Kiểm định giả thuyết mẫu Kiểm định cho kỳ vọng Kiểm định cho kỳ vọng - σ biết Ví dụ Doanh thu cửa hàng biến ngẫu nhiên X(triệu/tháng) có độ lệch chuẩn triệu/tháng Điều tra ngẫu nhiên doanh thu 500 cửa hàng có qui mơ tương tự ta tính doanh thu trung bình 10 triệu/tháng Có người cho thu nhập trung bình cửa hàng loại phải triệu/tháng Với mức ý nghĩa 5% kết luận nhận xét Bài làm X doanh thu cửa hàng loại xét, EX = µ , V X = σ với σ = Cặp giả thuyết: H0 : µ = µ0 H1 : µ > µ0 (với µ0 = 9) X − µ0 √ Chọn tiêu chuẩn kiểm định: Z = n ∼ N (0; 1) H0 σ x − µ0 √ 10 − √ Giá trị quan sát k = n= 500 = 11, 18 σ Với α = 0, 05, miền bác bỏ H0 : Wα = (u1−α ; +∞) = (u0,95 ; +∞) = (1, 645; +∞) Do k ∈ Wα nên ta bác bỏ H0 chấp nhận H1 Nghĩa nhận xét Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Kiểm định giả thuyết mẫu Hà Nội, 8/34 tháng năm 2018 / 34 Kiểm định cho kỳ vọng Kiểm định cho kỳ vọng - σ chưa biết Trường hợp 2: σ chưa biết Do σ chưa biết nên ta thay s Chọn tiêu chuẩn kiểm định: Z = X − µ0 √ n ∼ t(n − 1) giả thuyết H0 s Từ mẫu cụ thể (x1 , x2 , , xn ), ta tính giá trị quan sát: k = x − µ0 √ n s Miền bác bỏ H0 xác định cho trường hợp sau: Miền bác bỏ H0 : Wα H0 H1 µ = µ0 µ 6= µ0 µ = µ0 µ > µ0 (t(n − 1; − α); +∞) µ = µ0 µ < µ0 (−∞; −t(n − 1; − α)) Lê Xuân Lý (SAMI-HUST) (−∞; −t(n − 1; − Thống kê - Kiểm định giả thuyết α )) ∪ (t(n − 1; − α ); +∞) Hà Nội, 9/34 tháng năm 2018 / 34 Kiểm định giả thuyết mẫu Kiểm định cho kỳ vọng Kiểm định cho kỳ vọng - σ chưa biết Chú ý Nếu n > 30 ta chuyển từ tiêu chuẩn kiểm định theo phân phối Student sang phân phối chuẩn, nghĩa ta dùng : Chọn tiêu chuẩn kiểm định: Z = X − µ0 √ n ∼ N (0; 1) giả thuyết H0 s Từ mẫu cụ thể (x1 , x2 , , xn ), ta tính giá trị quan sát: k = x − µ0 √ n s Miền bác bỏ H0 xác định cho trường hợp sau: H0 H1 Miền bác bỏ H0 : Wα µ = µ0 µ 6= µ0 (−∞; −u1− α2 ) ∪ (u1− α2 ; +∞) µ = µ0 µ > µ0 (u1−α ; +∞) µ = µ0 µ < µ0 (−∞; −u1−α ) Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Kiểm định giả thuyết mẫu Hà Nội, 10/34 tháng năm 2018 10 / 34 Kiểm định cho kỳ vọng Kiểm định cho kỳ vọng - σ chưa biết Ví dụ: Ví dụ trước sửa hợp với thực tế Doanh thu cửa hàng biến ngẫu nhiên X(triệu/tháng) Điều tra ngẫu nhiên doanh thu 500 cửa hàng có qui mơ tương tự ta tính doanh thu trung bình 10 triệu/tháng độ lệch chuẩn mẫu hiệu chỉnh triệu/tháng Có người cho thu nhập trung bình cửa hàng loại phải triệu/tháng Với mức ý nghĩa 5% kết luận nhận xét Bài làm X doanh thu cửa hàng loại xét, EX = µ , V X = σ Cặp giả thuyết: H0 : µ = µ0 H1 : µ > µ0 (với µ0 = 9) X − µ0 √ Chọn tiêu chuẩn kiểm định: Z = n ∼ t(n − 1) H0 s x − µ0 √ 10 − √ Giá trị quan sát k = n= 500 = 11, 18 s Với α = 0, 05, miền bác bỏ H0 : Wα = (t(n − 1; − α); +∞) = (t(499; 0, 95); +∞) = (1, 645; +∞) Do k ∈ Wα nên ta bác bỏ H0 chấp nhận H1 Nghĩa nhận xét Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Hà Nội, 11/34 tháng năm 2018 11 / 34 Kiểm định giả thuyết mẫu Kiểm định cho kỳ vọng Kiểm định cho kỳ vọng - σ chưa biết Chú ý Do n > 30 nên ta hồn tồn chuyển phân phối Student thành phân phối chuẩn Bài giải làm sau: Bài làm X doanh thu cửa hàng loại xét, EX = µ , V X = σ Cặp giả thuyết: H0 : µ = µ0 H1 : µ > µ0 (với µ0 = 9) X − µ0 √ n ∼ N (0; 1) H0 s 10 − √ x − µ0 √ n= 500 = 11, 18 Giá trị quan sát k = s Với α = 0, 05, miền bác bỏ H0 : Wα = (u1−α ; +∞) = (u0,95 ; +∞) = (1, 645; +∞) Chọn tiêu chuẩn kiểm định: Z = Do k ∈ Wα nên ta bác bỏ H0 chấp nhận H1 Nghĩa nhận xét Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Kiểm định giả thuyết mẫu Hà Nội, 12/34 tháng năm 2018 12 / 34 Kiểm định cho kỳ vọng Kiểm định mãu cho kỳ vọng Ví dụ Điều tra suất lúa diện tích 100 hécta trồng lúa vùng, ta thu bảng số liệu sau: Năng suất (tạ/ha) Số có suất tương ứng 41 10 44 20 45 30 46 15 48 10 52 10 54 Liệu kết luận "Năng suất lúa trung bình hécta không thấp 48 tạ/ha" hay không với mức ý nghĩa 5%? Ví dụ Quan sát tuổi thọ số người vùng ta có bảng số liệu sau: Tuổi(năm) Số người 20-30 30-40 14 40-50 25 50-60 40 60-70 35 70-80 13 Với mức ý nghĩa 5% liệu ta khẳng định tuổi thọ trung bình người vùng 60 hay không? Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Hà Nội, 13/34 tháng năm 2018 13 / 34 Kiểm định giả thuyết mẫu Kiểm định cho tỷ lệ Kiểm định cho tỷ lệ Bài toán Xác suất xảy kiện A p Do p nên người ta thực n phép thử độc lập, điều kiện Trong có m phép thử xảy A f = m/n ước lượng điểm không chệch cho p Câu hỏi: Hãy so sánh p với giá trị p0 cho trước Cách giải quyết: tương tự cách làm cho kỳ vọng Bài toán đặt ta cần so sánh p với giá trị p0 cho trước Giả thuyết H0 Đối thuyết H1 p ≤ p0 p > p0 p = p0 p 6= p0 p ≥ p0 p < p0 Tuy nhiên giả thuyết ln có dấu "=" nên người ta cần viết giả thuyết H : p = p0 Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Kiểm định giả thuyết mẫu Hà Nội, 14/34 tháng năm 2018 14 / 34 Kiểm định cho tỷ lệ Kiểm định giả thuyết cho tỷ lệ Cách giải Cách xử lý tương tự với kỳ vọng Chọn tiêu chuẩn kiểm định: Z = p √ f − p0 n ∼ N (0; 1) giả thuyết H0 p0 (1 − p0 ) √ f − p0 Từ mẫu thu thập, ta tính giá trị quan sát: k = Z = p n với p0 (1 − p0 ) m f= n Miền bác bỏ H0 xác định cho trường hợp sau: H0 H1 Miền bác bỏ H0 : Wα p = p0 p 6= p0 (−∞; −u1− α2 ) ∪ (u1− α2 ; +∞) p = p0 p > p0 (u1−α ; +∞) p = p0 p < p0 (−∞; −u1−α ) Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Hà Nội, 15/34 tháng năm 2018 15 / 34 ... (1, 645; +∞) Do k ∈ Wα nên ta bác bỏ H0 chấp nhận H1 Nghĩa nhận xét Lê Xuân Lý (SAMI-HUST) Thống kê - Kiểm định giả thuyết Hà Nội, 11 /34 tháng năm 2 018 11 / 34 Kiểm định giả thuyết mẫu Kiểm định. .. vọng Kiểm định mãu cho kỳ vọng Ví dụ Điều tra suất lúa diện tích 10 0 hécta trồng lúa vùng, ta thu bảng số liệu sau: Năng suất (tạ/ha) Số có suất tương ứng 41 10 44 20 45 30 46 15 48 10 52 10 54 Liệu... µ = µ0 H1 : µ > µ0 (với µ0 = 9) X − µ0 √ Chọn tiêu chuẩn kiểm định: Z = n ∼ N (0; 1) H0 σ x − µ0 √ 10 − √ Giá trị quan sát k = n= 500 = 11 , 18 σ Với α = 0, 05, miền bác bỏ H0 : Wα = (u1−α ; +∞)