Thực hành trên R bài toán kiểm định giả thuyết Đỗ Thị Thanh Châu 20185434 Lê Thành Trung 20185486 Nguyễn Quang Huy 20185454 Hoàng Tú Linh 20185463 Nguyễn Đức Thiện 20173589 h Tóm tắt nội dung Kiểm địn[.]
Thực hành R toán kiểm định giả thuyết Đỗ Thị Thanh Châu 20185434 Lê Thành Trung 20185486 Nguyễn Quang Huy 20185454 Hoàng Tú Linh 20185463 Nguyễn Đức Thiện 20173589 h Tóm tắt nội dung Kiểm định giả thuyết phương pháp suy diễn cho phép xét tính hợp lý giả thuyết, nhận định cụ thể, thay dựa tính tốn ước lượng điểm hay xây dựng khoảng Trong chương này, nghiên cứu số toán kiểm định giả thuyết h Mục lục Các khái niệm 1.1 Trị số p-value 1.1.1 Khái niệm 1.1.2 Xác định p-value 1.1.3 Mối quan hệ với khoảng tin cậy 1.2 Tỷ số hợp lý tổng quát 3 3 4 Các toán kiểm định 2.1 Kiểm định mẫu 2.1.1 Kiểm định cho kỳ vọng 2.1.2 Kiểm định cho tỷ lệ 2.1.3 Kiểm định cho phương sai 2.2 So sánh hai mẫu 2.2.1 So sánh hai kỳ vọng 2.2.2 So sánh hai tỷ lệ 2.2.3 So sánh hai phương sai 2.2.4 Quan hệ khoảng tin cậy kiểm định giả thuyết 2.3 Phân tích phương sai 2.3.1 Kiểm định F 2.3.2 So sánh với t − test 2.3.3 Kiểm định Turkey 2.4 Kiểm định phi tham số 2.4.1 Kiểm định phân phối xác suất 2.4.2 Kiểm định tính độc lập hai biến định tính 5 10 13 13 18 20 21 21 21 23 23 24 24 26 h Chương Các khái niệm 1.1 1.1.1 Trị số p-value Khái niệm Khái niệm: p-value xác suất nhận liệu tệ H0 Bộ liệu tệ có H0 hợp lý so với liệu ta có: Nếu H0 đúng, phép thử không nhận loại liệu ta có p-value thể mức độ hợp lý giả thuyết null dựa liệu x1 , , xn p-value nhỏ, H0 hợp lý Liên hệ với mức ý nghĩa α, xác suất xảy sai lầm loại I: Mức ý nghĩa α nhỏ đồng với quan điểm bảo vệ giả thuyết H0 Nghĩa bác bỏ giả thuyết H0 có đủ chứng sai Bác bỏ H0 p-value < α Ngược lại, chấp nhận H0 p-value > α 1.1.2 Xác định p-value Xét ví dụ tốn kiểm định phía với kỳ vọng Mức độ khơng tương thích liệu với giả thuyết null đo thống kê t √ n ( x − µ0 ) ∼ t ( n − 1) t= s p-value xác suất sinh liệu với µ = µ0 có thống kê t có trị tuyệt đối > |t| p-value = P( X ≥ |t|) + P( X ≤ |t|) = 2P( X ≥ |t|) α ( n −1) Ta bác bỏ H0 p-value ≤ α Kết hợp P X ≥ t α = , trở thành 2 ( n −1) |t| > t α h ( n −1) Như vậy, bác bỏ H0 |t| > t α Nhận xét: Phương pháp thống với cách trình bày miền bác bỏ giảng Miền bác bỏ xác định theo bước sau: Chọn thống kê phù hợp biểu thị mức độ khơng tương thích liệu với giả thuyết H0 Xác định phân phối thống kê Dựa p-value phân phối thống kê, xây dựng miền bác bỏ 1.1.3 Mối quan hệ với khoảng tin cậy Nếu µ0 nằm khoảng tin cậy với độ tin cậy γ = − α p-value tốn kiểm định H0 : µ = µ0 , H1 : µ 6= µ0 lớn α, nghĩa chấp nhận H0 Do đó, phương pháp khoảng tin cậy hoàn toàn cho phép kết luận chấp nhận hay bác bỏ giả thuyết H0 Thông thường, người ta hay dùng khoảng tin cậy xây dựng khoảng tin cậy − α cho µ có nhiều ý nghĩa kiểm định giả thuyết cớ α 1.2 Tỷ số hợp lý tổng quát Trong chương ta nghiên cứu số toán kiểm định mà nhà thống kê quan tâm giải toán thực tế Các toán dựa khái niệm tỷ số hợp lý tổng quát (generalized likelihood ratio) Đây nguyên lý quan trọng dùng để gợi ý trình kiểm định thưc tế Định nghĩa: Cho y1 , , yn mẫu ngẫu nhiên với tham số θ1 , , θk Kí hiệu ω, Ω không gian tham số chưa biết H0 đúng, không gian tất tham số chưa biết Tỷ số hợp lý tổng quát, max L(θ1 , , θk ) L ( ωc ) λ= ω = max L(θ1 , , θk ) L(Ωc ) Ω Ta bác bỏ H0 < λ < λ∗ , λ∗ thỏa mãn P < Λ < λ∗ | H0 = α Sử dụng nguyên lý này, người ta xây dựng phân phối cho toán kiểm định h Chương Các toán kiểm định 2.1 Kiểm định mẫu 2.1.1 Kiểm định cho kỳ vọng Xét biến ngẫu nhiên X có kỳ vọng µ phương sai σ Nếu mẫu có phân phối chuẩn có cỡ đủ lớn thống kê X−µ Z= σ √ n có phân phối chuẩn tắc Trường hợp biết phương sai Kết quả: Cho y1 , , yn mẫu ngẫu nhiên cỡ n có phân phối chuẩn với phương sai σ2 biết Đặt z= x − µ0 σ √ n Kiểm định H0 : µ = µ0 H1 : µ 6= µ0 với mức ý nghĩa α, bác bỏ H0 z ≤ −z α z ≥ z α 2 Ví dụ: Một hãng bảo hiểm thơng báo số tiền trung bình hãng chi trả cho khách hàng bị tai nạn ô tô 8500 USD Để kiểm tra lại, người ta kiểm tra ngẫu nhiên hồ sơ chi trả 25 khách hàng thấy số tiền trung bình chi trả 8900 USD Giả sử số tiền chi trả tuân theo luật phân phối chuẩn với độ lệch chuẩn 2600 USD Hãy kiểm định lại thông báo hãng bảo hiểm với mức ý nghĩa 5% [24]: utest = function(x_, mu, sigma, n, anpha, alternative) { u = (x_ - mu )* sqrt(n)/sigma ketqua = "" if (alternative == "two.sided") { if ((u >= qt(1-anpha/2,df = n-1)) | ( u 0.05 Ta kết luận “Chưa có sở để bác bỏ H0 ” Từ ta chấp nhận quảng cáo công ty Trường hợp chưa biết phương sai, n ≥ 30 Khi cỡ mẫu đủ lớn, phân phối Student tiến dần đến phân phối chuẩn Trong trường hợp này, thống kê X − µ√ U= n S có phân phối chuẩn tắc n ≥ 30 Kiểm định H0 : µ = µ0 H1 : µ 6= µ0 với mức ý nghĩa α, bác bỏ H0 u ≤ −u α u ≥ u α 2 Ví dụ: Một cơng ty có hệ thống máy tính xử lý 1200 hóa đơn Công ty nhập hệ thống máy tính Hệ thống chạy kiểm tra 40 cho thấy số hóa đơn xử lý trung bình 1260 với độ lệch chuẩn hiệu chỉnh 215 Với mức ý nghĩa 5% nhận định xem hệ thống có tốt hệ thống cũ hay không? h Đặt giả thuyết: H0 : µ = µ0 = 1200 H1 : µ > µ0 [26]: utest(x_ = 1260, mu = 1200, sigma = 215, n=40, anpha = 0.05, alternative =␣ ,→"right") [1] "Bac bo H0" Vậy điều nghi ngờ có sở với mức ý nghĩa 5% Chú ý: Ở dù cỡ mẫu lớn 30 hay nhỏ 30 ta dùng hàm utest() phân phối student hội tụ đến chuẩn mà cỡ mẫu lớn 30 2.1.2 Kiểm định cho tỷ lệ Giả sử liệu k1 , , k n biểu diễn kết n phép thử Bernoulli Tổng số lần “thành công”, X, n phép thử độc lập, có phân phối nhị thức Có trường hợp khác dựa cỡ mẫu n Nếu cỡ mẫu n đủ lớn, ta tiến hành kiểm định H0 : p = p0 dựa phân phối tiệm cận chuẩn Nếu mẫu nhỏ, miền bác bỏ xác định xác phân phối nhị thức ứng với biến X Trường hợp mẫu cỡ lớn Kết quả: Cho k1 , , k n mẫu ngẫu nhiên cỡ n có phân phối Bernoulli thỏa mãn q q < np0 − np0 (1 − p0 ) < np0 + np0 (1 − p0 ) < n Đặt k = k1 + + k n số lần “thành công” n phép thử Thống kê Z= p k − np np(1 − p) có phân phối chuẩn tắc Nếu giả thuyết H0 đúng, có z = p k − np0 np0 (1 − p0 ) Kiểm định H0 : p = p0 H1 : p 6= p0 với mức ý nghĩa α, bác bỏ H0 z ≤ −z α z ≥ z α 2 Chú ý: Có nhiều cách để chọn mẫu cỡ đủ lớn Trên thực tế, thay kiểm tra bất đẳng thức trên, tiếp cận dạng đơn giản kiểm tra np0 > n(1 − p0 ) > Ví dụ: Một cơng ty A sản xuất bánh kẹo tuyên bố 1/2 số trẻ em thích ăn bánh kẹo công ty Trong mẫu gồm 100 trẻ em hỏi, có 47 em tỏ thích ăn bánh công ty Với mức ý nghĩa 5%, số liệu có chứng tỏ tun bố cơng ty hay không? Đặt giả thuyết H0 : p = p0 = H1 : p 6= p0 Ta sử dụng kiểm định prop.test() h [29]: prop.test(47,100,0.5,alternative = "two.sided") 1-sample proportions test with continuity correction data: 47 out of 100, null probability 0.5 X-squared = 0.25, df = 1, p-value = 0.6171 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.3703535 0.5719775 sample estimates: p 0.47 Giá trị p-value = 0.6171 > 0.05 Ta kết luận “chưa có sở để bác bỏ H0 ” Ta nói tuyên bố cơng ty có sở Ta sử dụng kiểm định khác binom.test() [30]: binom.test(47,100,0.5,alternative = "two.sided") Exact binomial test data: 47 and 100 number of successes = 47, number of trials = 100, p-value = 0.6173 alternative hypothesis: true probability of success is not equal to 0.5 95 percent confidence interval: 0.3694052 0.5724185 sample estimates: probability of success 0.47 Giá trị p-value = 0.6173 > 0.05 gần giống với kiểm định prop.test() Ta kết luận “chưa có sở để bác bỏ H0 ” tun bố cơng ty có sở Trường hợp mẫu cỡ nhỏ p p Trong trường hợp bất đẳng thức < np0 − np0 (1 − p0 ) < np0 + np0 (1 − p0 ) < n không thỏa mãn, miền bác bỏ xác định trực tiếp phân phối nhị thức, thay phân phối chuẩn Ví dụ: Có 19 bệnh nhân điều trị thuốc giảm đau Đánh giá thực tế có 85% bệnh nhân cho kết tốt Hãy ước lượng cho tỷ lệ bệnh nhân có kết tốt sử dụng thuốc với mức nghĩa khoảng 10%? Ta muốn kiểm định H0 : p = 0.85 H1 : p 6= 0.85 Xét k = k1 + + k n số lần thành cơng h Ví dụ: Để so sánh hai chế độ chăm bón cho loại trồng A, mảnh ruộng người ta chia mảnh thành hai nửa: nửa thứ áp dụng phương pháp chăm bón I, nửa thứ hai theo phương pháp chăm bón II Sau thu hoạch ta số liệu suất loại trồng A sau: Đánh giá xem hai chế độ chăm bón có giống khơng với mức ý nghĩa 1% Biết suất loại trồng A (sau hai phương pháp chăm bón) có phân phối chuẩn Đặt giả thiết: H0 : µ1 = µ2 H1 : µ1 6= µ2 [43]: ns1 = c(5, 20, 16, 22, 24, 14, 18, 20) ns2 = c(15, 22, 14, 25, 29, 16, 20, 24) bp = data.frame(ns1, ns2) t.test(bp$ns1, bp$ns2, paired=TRUE,conf.level = 0.01) Paired t-test data: bp$ns1 and bp$ns2 t = -2.694, df = 7, p-value = 0.03091 alternative hypothesis: true difference in means is not equal to percent confidence interval: -3.265668 -3.234332 sample estimates: mean of the differences -3.25 Nhận thấy giá trị p-value = 0.02 > 0.01 nên ta kết luận “chưa có sở để bác bỏ H0 ” Có thể coi hai chế độ chăm bón có giống khơng với mức ý nghĩa 1% Trường hợp mẫu độc lập Xét ước lượng X − Y ước lượng khơng chệch µ X − µY X − Y σ2 σX2 V (Y ) = Y n1 n2 s σ2 σX2 s.e( X − Y ) = + Y n1 n2 Hơn nữa, X Y độc lập, V ( X ) = 14 h Có thật độ xác tốn kiểm định H0 : µ X = µY phụ thuộc nhiều vào phương sai X Y Nếu σX = σY , sử dụng tỷ số hợp lý tổng quát, ta giải tốn kiểm định µ X = µY Nhưng giả sử σX = σY , toán trở nên phức tạp nhiều Bài toán biết đến toán Behrens-Fisher, tồn 25 năm toán chưa có lời giải tiếng thống kê Có số lời giải xấp xỉ đưa ra, để đơn giản, trước hết ta giả sử σX = σY Kết quả: Cho X Y mẫu ngẫu nhiên có phân phối chuẩn độc lập với có phương sai σ Khi đó, ước lượng cho σ σˆ = S2p = s Đồng thời, từ s.e( X − Y ) = (n1 − 1)S2X + (n2 − 1)SY2 n1 + n2 − σ2 σX2 + Y , ta có n1 n2 s s.e( X − Y ) = S p 1 + n1 n2 Chọn thống kê T= s X − Y − ( µ X − µY ) (n1 − 1)S2X + (n2 − 1)SY2 1 + n1 + n2 − n1 n2 có phân phối Student với n1 + n2 − bậc tự Giá trị quan sát t= ( n + m −2) Bác bỏ giả thuyết H0 |t| > t α x−y r 1 sp + n1 n2 Ta thường áp dụng tình đây: a) Trường hợp chưa biết phương sai, cỡ mẫu nhỏ n1 < 30, n2 < 30 Ví dụ: Người ta ghi lại sản lượng lúa mì, tính tạ/héc-ta mảnh ruộng bón lót 50 100 đơn vị đạm héc-ta Bón 50 đơn vị: 47,2; 43,1; 35,7; 47,0; 5,7; 42,6; 46,7; 42,3 Bón 100 đơn vị: 47,9; 48,9; 43,5; 53,1; 50,8; 46,1; 41,1; 43,0; 41,0; 48,5; 47,7 Với mức ý nghĩa 5% kết luận bón lót 100 đơn vị đạm cho suất cao bón lót 50 đơn vị đạm hay khơng? Đặt giả thuyết: H0 : µ1 = µ2 H1 : µ1 > µ2 15 h [34]: phuongphap1 = c(47.2,43.1,35.7,47.0,5.7,42.6,46.7,42.3) phuongphap2 = c(47.9,48.9,43.5,53.1,50.8,46.1,41.1,43,41,48.5,47.7) [35]: t.test(phuongphap1,phuongphap2,alternative = "greater") Welch Two Sample t-test data: phuongphap1 and phuongphap2 t = -1.528, df = 7.8286, p-value = 0.9171 alternative hypothesis: true difference in means is greater than 95 percent confidence interval: -17.14529 Inf sample estimates: mean of x mean of y 38.78750 46.50909 Ta có p-value = 0.9171 > 0.05 nên “chưa có sở để bác bỏ H0 ” Ta kết luận chưa thể khẳng định bón lót 100 đơn vị đạm cho suất cao bón lót 50 đơn vị đạm với mức ý nghĩa 5% Tìm thống kê với phân phối biết để kiểm định hai kỳ vọng từ mẫu có phân phối chuẩn độ lệch chuẩn mẫu khơng gọi tốn Behrens-Fisher Bài tốn khơng có lời giải xác, xấp xỉ dùng phổ biến dựa thống kê W= X − Y − ( µ X − µY ) s S2 S2X + Y n1 n2 Kết quả: Cho X Y mẫu ngẫu nhiên có phân phối chuẩn độc lập với Xét W= X − Y − ( µ X − µY ) s S2 S2X + Y n1 n2 có phân phối xấp xỉ phân phối Student với bậc tự n θ+ m v= 2 , θ n + n−1 m−1 m θ= S2X SY2 Khi mẫu đủ lớn, phân phối Student tiến đến phân phối chuẩn nên thống kê U= X − Y − ( µ X − µY ) s S2 S2X + Y n1 n2 16 h có phân phối chuẩn tắc Giá trị quan sát u= s x−y s2 s2X + Y n1 n2 Bác bỏ giả thuyết H0 |z| > z α Trong thực tế, người ta thường chọn mẫu lớn mẫu có n1 > 30, n2 > 30 b) Trường hợp chưa biết phương sai, cỡ mẫu lớn n1 ≥ 30, n2 ≥ 30 Ví dụ: Hai máy tự động dùng để cắt kim loại kỹ thuật viên phụ trách chỉnh Từ máy lấy 31 kim loại để kiểm tra thu kết sau: Máy 1: Trung bình mẫu 12 cm, độ lệch chuẩn hiệu chỉnh 1,2 cm Máy 2: Trung bình mẫu 12,3 cm, độ lệch hiệu chỉnh 1,4 cm Với mức ý nghĩa α = 0,01 cho chiều dài kim loại máy sản xuất khác chiều dài máy sản xuất hay không Biết chiều dài kim loại máy sản xuất có phân phối chuẩn [36]: u2test = function(x_, y_, sigma.x, sigma.y, n.x, n.y, anpha, alternative) { u = (x_ - y_)/sqrt(sigma.x^2/n.x + sigma.y^2/n.y) ketqua = "" if (alternative == "two.sided") { if ((u >= qnorm(1-anpha/2)) | ( u z α Chú ý: X Y có phân phối chuẩn độc lập với 2.2.2 So sánh hai tỷ lệ Trong toán này, X Y khơng cịn có phân phối chuẩn mà có phân phối nhị thức Theo định lý giới hạn trung tâm X Y X Y − −E − n1 n n1 n2 s2 Y X V − n1 n2 có phân phối tiệm cận chuẩn Khi H0 ta có X Y X Y ( n + n2 ) p (1 − p ) E − = V − = n1 n2 n1 n2 n1 n2 Thay p x+y , ước lượng hợp lý cực đại nó, H0 đúng, ta có: n1 + n2 18 h Kết quả: Cho x y số lần “thành công” tập độc lập n m phép thử Bernoulli Đặt x+y định nghĩa f = n1 + n2 x y − n1 n2 z= s f (1 − f ) f (1 − f ) + n1 n2 Kiểm định H0 : p X = pY H1 : p X 6= pY với mức ý nghĩa α: Bác bỏ H0 z ≤ −z α z ≥ z α 2 Chú ý: Để dùng phân phối tiệm cận chuẩn trên, ta cần kiểm tra điều kiện (n1 + n2 ) f > (n1 + n2 )(1 − f ) > Ví dụ: Từ kho đồ hộp thứ lấy ngẫu nhiên 1000 hộp để kiểm tra thấy có 20 hộp bị hỏng Từ kho đồ hộp thứ hai lấy ngẫu nhiên 900 hộp kiểm tra thấy 30 hộp bị hỏng Hỏi chất lượng bảo quản kho có thực giống hay khơng với mức ý nghĩa 5% Đặt giả thuyết: H0 : p1 = p2 H1 : p1 6= p2 [44]: hopbihong = c(20,30) hoptongthe = c(1000,900) prop.test(hopbihong, hoptongthe) 2-sample test for equality of proportions with continuity correction data: hopbihong out of hoptongthe X-squared = 2.7867, df = 1, p-value = 0.09505 alternative hypothesis: two.sided 95 percent confidence interval: -0.02897746 0.00231079 sample estimates: prop prop 0.02000000 0.03333333 Kết phân tích cho thấy tỉ lệ gãy xương nhóm 0.02 nhóm 0.03 Với trị số p-value = 0.095 > 0.05 Từ “chưa có sở bác bỏ H0 ” Suy tỉ lệ hộp hỏng hai nhóm giống với mức ý nghĩa 5% Ví dụ: Trong 102 bệnh nhân điều trị phương pháp I có 82 bệnh nhân khỏi bệnh Trong 98 bệnh nhân điều trị phương pháp II có 69 bệnh nhân khỏi bệnh Hỏi có phải phương pháp I điều trị tốt phương pháp II hai hay không với mức ý nghĩa 5%? 19 h