Giả thuyết thống kê là những phát biểu về các tham số, quy luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. • Việc tìm ra kết luận để bác bỏ hay chấp nhận 1 giả thuyết gọi là kiểm định giả thuyết thống kê. Ví dụ 1 Giám đốc 1 nhà máy sản xuất máy tính tuyên bố rằng tuổi thọ trung bình của máy tính do nhà máy sản xuất ra là 10 năm; đây là 1 giả thuyết về kỳ vọng của biến ngẫu nhiên X = tuổi thọ trung của 1 máy tính. Để đưa ra kết luận là chấp nhận hay bác bỏ giả thuyết trên, ta cần dựa vào mẫu điều tra và quy tắcGiả thuyết thống kê là những phát biểu về các tham số, quy luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. • Việc tìm ra kết luận để bác bỏ hay chấp nhận 1 giả thuyết gọi là kiểm định giả thuyết thống kê. Ví dụ 1 Giám đốc 1 nhà máy sản xuất máy tính tuyên bố rằng tuổi thọ trung bình của máy tính do nhà máy sản xuất ra là 10 năm; đây là 1 giả thuyết về kỳ vọng của biến ngẫu nhiên X = tuổi thọ trung của 1 máy tính. Để đưa ra kết luận là chấp nhận hay bác bỏ giả thuyết trên, ta cần dựa vào mẫu điều tra và quy tắcGiả thuyết thống kê là những phát biểu về các tham số, quy luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. • Việc tìm ra kết luận để bác bỏ hay chấp nhận 1 giả thuyết gọi là kiểm định giả thuyết thống kê. Ví dụ 1 Giám đốc 1 nhà máy sản xuất máy tính tuyên bố rằng tuổi thọ trung bình của máy tính do nhà máy sản xuất ra là 10 năm; đây là 1 giả thuyết về kỳ vọng của biến ngẫu nhiên X = tuổi thọ trung của 1 máy tính. Để đưa ra kết luận là chấp nhận hay bác bỏ giả thuyết trên, ta cần dựa vào mẫu điều tra và quy tắc
Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ TĂNG LÂM TƯỜNG VINH Khoa Toán - Tin Học Đại Học Khoa Học Tự Nhiên Tp.HCM Tp Hồ Chí Minh, 05/11/2018 TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu Nội dung Bài toán kiểm định giả thuyết thống kê Kiểm định giả thuyết cho trường hợp mẫu Kiểm định giả thuyết cho trường hợp mẫu độc lập TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu Nội dung Bài toán kiểm định giả thuyết thống kê Kiểm định giả thuyết cho trường hợp mẫu Kiểm định giả thuyết cho trường hợp mẫu độc lập TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu Bài toán kiểm định giả thuyết thống kê Định nghĩa • Giả thuyết thống kê phát biểu tham số, quy luật phân phối, tính độc lập đại lượng ngẫu nhiên • Việc tìm kết luận để bác bỏ hay chấp nhận giả thuyết gọi kiểm định giả thuyết thống kê Ví dụ Giám đốc nhà máy sản xuất máy tính tuyên bố tuổi thọ trung bình máy tính nhà máy sản xuất 10 năm; giả thuyết kỳ vọng biến ngẫu nhiên X = tuổi thọ trung máy tính Để đưa kết luận chấp nhận hay bác bỏ giả thuyết trên, ta cần dựa vào mẫu điều tra quy tắc kiểm định thống kê TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu Bài toán kiểm định giả thuyết thống kê Định nghĩa Trong toán kiểm định giả thuyết, giả thuyết cần kiểm định gọi Giả thuyết không (null hypothesis), ký hiệu H0 Mệnh đề đối lập với H0 gọi đối thuyết (alternative hypothesis), ký hiệu H1 Ví dụ Gọi µ độ thay đổi trung bình huyết áp bệnh nhân sau dùng thuốc; bác sĩ điều trị cần quan tâm đến giả thuyết sau H0 : µ = Khơng có ảnh hưởng thuốc lên huyết áp bệnh nhân H1 : µ = Có ảnh hưởng thuốc lên huyết áp bệnh nhân TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu Sai lầm loại I loại II Thực tế Quyết định Không bác bỏ H0 Bác bỏ H0 TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ H0 H0 sai Khơng có sai lầm Sai lầm loại I Sai lầm loại II Khơng có sai lầm XÁC SUẤT THỐNG KÊ Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu Nội dung Bài toán kiểm định giả thuyết thống kê Kiểm định giả thuyết cho trường hợp mẫu Kiểm định giả thuyết cho trường hợp mẫu độc lập TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu Kiểm định giả thuyết cho trường hợp mẫu Kiểm định giả thuyết cho kỳ vọng • Trường hợp biết phương sai • Trường hợp khơng biết phương sai, mẫu nhỏ • Trường hợp khơng biết phương sai, mẫu lớn Kiểm định giả thuyết cho tỷ lệ TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu Kiểm định giả thuyết cho kỳ vọng - TH biết σ Các giả định: • Mẫu ngẫu nhiên X1 , , Xn chọn từ tổng thể có phân phối chuẩn N (µ, σ ) với kỳ vọng µ chưa biết • Phương sai σ biết • Cho trước giá trị µ0 , cần so sánh kỳ vọng µ với µ0 Bài tốn kiểm định có trường hợp: (a) H : µ = µ0 H : µ = µ0 (b) H : µ = µ0 H1 : µ < µ0 (c) H : µ = µ0 H1 : µ > µ0 với mức ý nghĩa α cho trước TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu Kiểm định giả thuyết cho kỳ vọng - TH biết σ Các bước kiểm định Phát biểu giả thuyết không đối thuyết Xác định mức ý nghĩa α Lấy mẫu ngẫu nhiên cỡ n : X1 , , Xn tính thống kê kiểm định X − µ0 √ Z0 = σ/ n Z0 ∼ N (0, 1) Xác định miền bác bỏ Wα : bảng TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 10 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu So sánh hai kỳ vọng Ví dụ Khảo sát chiều cao sinh viên khoa Toán CNTT: chọn ngẫu nhiên 50 sinh viên khoa Tốn, tính chiều cao trung bình 163 cm độ lệch chuẩn cm Đo chiều cao 50 sinh viên khoa CNTT, có trung bình mẫu 166 cm độ lệch chuẩn cm Với mức ý nghĩa α = 1%, cho kết luận chiều cao sinh viên hai khoa TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 42 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu SS hai kỳ vọng, TH phương sai, mẫu nhỏ Các giả định • X1 , X2 , , Xn mẫu ngẫu nhiên chọn từ tổng thể có phân phối chuẩn với kỳ vọng µ1 phương sai σ12 khơng biết • Y1 , Y2 , , Ym mẫu ngẫu nhiên chọn từ tổng thể có phân phối chuẩn với kỳ vọng µ2 phương sai σ22 khơng biết • Tổng thể (đại diện X Y ) độc lập với • Cỡ mẫu nhỏ: n ≤ 30 m ≤ 30 Ta xét hai trường hợp: • Trường hợp phương sai σ12 = σ22 • Trường hợp phương sai khác σ12 = σ22 TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 43 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu So sánh hai phương sai • Giả sử X1 , , Xn Y1 , , Ym mẫu ngẫu nhiên chọn từ hai tổng thể độc lập có phân phối chuẩn với kỳ vọng phương sai (µ1 , σ12 ) (µ2 , σ22 ) Ta cần kiểm tra giả thuyết H0 : σ12 = σ22 (1) H1 : σ12 = σ22 • Nếu S12 phương sai mẫu ngẫu nhiên (X1 , , Xn ) (n − 1)S12 ∼ χ2 (n − 1) σ12 (2) (m − 1)S22 ∼ χ2 (m − 1) σ22 (3) tương tự, ta có TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 44 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu So sánh hai phương sai • Khi đại lượng F = S12 /σ12 S22 /σ22 có phân phối F với (n − 1, m − 1) bậc tự • Xét biến ngẫu nhiên F ∼ F(u, v) có hàm mật độ xác suất f (x), phân vị mức α F fα,u,v định nghĩa sau ∞ P(F > fα,u,v ) = f (x)dx = α (4) fα,u,v • Phân vị mức − α F cho f1−α,u,v = TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ fα,v,u (5) XÁC SUẤT THỐNG KÊ 45 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu So sánh hai phương sai Các bước kiểm định Phát biểu giả thuyết đối thuyết Xác định mức ý nghĩa α Khi H0 đúng, thống kê F = H0 : σ12 = σ22 H1 : σ12 = σ22 S12 S22 có phân phối F với (n − 1, m − 1) bậc tự Xác định miền bác bỏ: bác bỏ H0 F > fα/2,n−1,m−1 F < f1−α/2,n−1,m−1 Kết luận: Nếu bác bỏ H0 , ta thấy luận H1 với (1 − α)100% độ tin cậy Ngược lại kết luận chưa đủ sở để bác bỏ H0 TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 46 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu SS hai kỳ vọng, mẫu nhỏ, TH σ12 = σ22 = σ • Trường hợp σ12 = σ22 = σ , ta sử dụng ước lượng chung cho σ12 σ22 Sp2 gọi phương sai mẫu chung (pooled sample variance) Sp2 = (n − 1)S12 + (m − 1)S22 n+m−2 (6) • Thống kê T0 = X − Y − (µ1 − µ2 ) 1 Sp + n m (7) có phân phối Student với n + m − bậc tự TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 47 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu SS hai kỳ vọng, mẫu nhỏ, TH σ12 = σ22 = σ • Đặt df = n + m − 2, miền bác bỏ p−giá trị trường hợp có dạng Đối thuyết Miền bác bỏ p−giá trị H : µ1 − µ2 = D |t0 | > tdf 1−α/2 p = 2P(Tdf ≥ |t0 |) H1 : µ1 − µ2 < D0 t0 < −tdf 1−α p = P(Tdf ≤ t0 ) H1 : µ1 − µ2 > D0 t0 > tdf 1−α p = P(Tdf ≥ t0 ) • Kết luận: Bác bỏ H0 / Chưa đủ sở để bác bỏ H0 TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 48 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu SS hai kỳ vọng, mẫu nhỏ, TH σ12 = σ22 • Khi σ12 = σ22 , sử dụng thống kê T0 = X − Y − (µ1 − µ2 ) (8) S12 S22 + n m • Khi T0 có phân phối Student với bậc tự df xác định sau s2 /n + s22 /m df = 2 (9) (s1 /n) (s22 /m)2 + n−1 m−1 • Miền bác bỏ trường hợp giống trường hợp phương sai nhau, thay bậc tự df cho phương trình (9) TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 49 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu So sánh hai phương sai Ví dụ Cho mẫu độc lập (n1 = 9; n2 = 11; s21 = 4, 23; s22 = 1, 56) từ tổng thể có phân phối chuẩn, kiểm định xem phương sai tổng thể có khơng? α = 10% Giải Phát biểu giả thuyết đối thuyết: Mức ý nghĩa: α = 0, Tính giá trị thống kê F = H0 : σ12 = σ22 H1 : σ12 = σ22 s21 4, 23 = 2, 7115 = 1, 56 s22 Xác định miền bác bỏ: bác bỏ H0 F > fα/2,n1 −1,n2 −1 = f0,05;8;10 = 3, 07 1 = = = 0, 299 F < f1−α/2,n1 −1,n2 −1 = fα/2,n2 −1,n1 −1 f0,05;10;8 3, 347 Kết luận: F = 2, 7115 < 3, 07 nên chưa đủ sở để bác bỏ H0 Với 90% độ tin cậy, phương sai mẫu TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 50 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu SS hai kỳ vọng, mẫu nhỏ, TH khơng biết phương sai Ví dụ 10 Tại thành phố, khu vực A, người ta chọn ngẫu nhiên 17 sinh viên cho làm kiểm tra số IQs, thu trung bình mẫu 106 độ lệch tiêu chuẩn 10; khu vực B, số IQs trung bình mẫu gồm 14 sinh viên 109 với độ lệch tiêu chuẩn Giả sử phương sai Có khác biệt số IQs sinh viên hai khu vực A B hay không? với α = 0, 02 TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 51 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu SS hai kỳ vọng, mẫu nhỏ, TH khơng biết phương sai Ví dụ 11 Hàm lượng thạch tín (Asen) (Đv: ppb) nước cao có hại cho sức khỏe Người ta kiểm tra hàm lượng thạch tín hai khu vực trung tâm thành phố Biên Hòa khu vực gần san bay Biên Hòa Tại khu vực, người ta đo ngẫu nhiên hàm lượng thạch tín nước ứng với 10 địa điểm khác Số liệu cho bảng thống kê bên Trung tâm TP Khu vực gần sân bay 25 10 15 12 25 15 48 44 40 38 33 21 20 12 18 Với α = 0, 05, kiểm tra xem có khác biệt hàm lượng thạch tín khu vực TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 52 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu So sánh hai tỷ lệ Khảo sát phần tử thỏa tính chất A tổng thể độc lập với tỷ lệ tương ứng p1 p2 ; từ tổng thể chọn mẫu với cỡ n m Gọi X Y số phần tử thỏa tính chất A mẫu mẫu Khi đó, ta có X ∼ B(n, p1 ) Y ∼ B(m, p2 ) Bài toán: so sánh tỷ lệ p1 p2 Bài toán kiểm định giả thuyết gồm trường hợp sau (a) H : p − p = D0 H : p − p = D0 (b) H : p − p = D0 H0 : p1 − p2 < D0 (c) H : p − p = D0 H : p1 − p2 > D0 Các giả định • Hai mẫu độc lập • Cỡ mẫu lớn: np1 > 5; n(1 − p1 ) > mp2 > 5; m(1 − p2 ) > TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 53 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu So sánh hai tỷ lệ Các bước kiểm định Phát biểu giả thuyết H0 đối thuyết H1 Xác định mức ý nghĩa α Tính thống kê Z0 = với X Pˆ1 = ; n Z0 ∼ N (0, 1) TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Pˆ1 − Pˆ2 − D0 (10) 1 + Pˆ (1 − Pˆ ) n m Y Pˆ2 = ; m X +Y Pˆ = n+m XÁC SUẤT THỐNG KÊ 54 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu So sánh hai tỷ lệ Xác định miền bác bỏ Đối thuyết Miền bác bỏ p−giá trị H1 : p − p = D0 |z0 | > z1−α/2 p = 2[1 − Φ(|z0 |)] H1 : p1 − p2 < D0 z0 < −z1−α p = Φ(z0 ) H1 : p1 − p2 > D0 z0 > z1−α p = − Φ(z0 ) Kết luận: Nếu bác bỏ H0 , ta thấy luận H1 với (1 − α)100% độ tin cậy Ngược lại kết luận chưa đủ sở để bác bỏ H0 TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 55 Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu So sánh hai tỷ lệ Ví dụ 12 Một công ty sản xuất thuốc cần kiểm tra loại thuốc có tác dụng giảm việc xuất đau ngực bệnh nhân Công ty thực thí nghiệm 400 người, chia làm nhóm: nhóm gồm 200 uống thuốc nhóm gồm 200 người uống giả dược Theo dõi thấy nhóm có người lên đau ngực nhóm có 25 người lên đau ngực Với α = 0, 05, cho kết luận hiệu thuốc sản xuất TĂNG LÂM TƯỜNG VINH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ 56 ... KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ XÁC SUẤT THỐNG KÊ Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu Nội dung Bài toán kiểm định giả thuyết thống kê Kiểm định giả thuyết cho trường hợp mẫu Kiểm định. .. toán kiểm định giả thuyết thống kê Định nghĩa Trong toán kiểm định giả thuyết, giả thuyết cần kiểm định gọi Giả thuyết không (null hypothesis), ký hiệu H0 Mệnh đề đối lập với H0 gọi đối thuyết. .. sai lầm XÁC SUẤT THỐNG KÊ Bài toán kiểm định Trường hợp mẫu Trường hợp mẫu Nội dung Bài toán kiểm định giả thuyết thống kê Kiểm định giả thuyết cho trường hợp mẫu Kiểm định giả thuyết cho trường