Thực hành trên R bài toán kiểm định giả thuyết Đỗ Thị Thanh Châu 20185434 Lê Thành Trung 20185486 Nguyễn Quang Huy 20185454 Hoàng Tú Linh 20185463 Nguyễn Đức Thiện 20173589 Tóm tắt nội dung Kiểm định[.]
Thực hành R toán kiểm định giả thuyết Đỗ Thị Thanh Châu 20185434 Lê Thành Trung 20185486 Nguyễn Quang Huy 20185454 Hoàng Tú Linh 20185463 Nguyễn Đức Thiện 20173589 Tóm tắt nội dung Kiểm định giả thuyết phương pháp suy diễn cho phép xét tính hợp lý giả thuyết, nhận định cụ thể, thay dựa tính tốn ước lượng điểm hay xây dựng khoảng Trong chương này, nghiên cứu số toán kiểm định giả thuyết Mục lục Các khái niệm 1.1 Trị số p-value 1.1.1 Khái niệm 1.1.2 Xác định p-value 1.1.3 Mối quan hệ với khoảng tin cậy 1.2 Tỷ số hợp lý tổng quát Các toán kiểm định 2.1 Kiểm định mẫu 2.1.1 Kiểm định cho kỳ vọng 2.1.2 Kiểm định cho tỷ lệ 2.1.3 Kiểm định cho phương sai 2.2 So sánh hai mẫu 2.2.1 So sánh hai kỳ vọng 2.2.2 So sánh hai tỷ lệ 2.2.3 So sánh hai phương sai 2.2.4 Quan hệ khoảng tin cậy kiểm định giả thuyết 2.3 Phân tích phương sai 2.3.1 Kiểm định F 2.3.2 So sánh với t test 2.3.3 Kiểm định Turkey 2.4 Kiểm định phi tham số 2.4.1 Kiểm định phân phối xác suất 2.4.2 Kiểm định tính độc lập hai biến định tính 3 3 4 5 10 13 13 18 20 21 21 21 23 23 24 24 26 Chương Các khái niệm 1.1 Trị số p-value 1.1.1 Khái niệm Khái niệm: p-value xác suất nhận liệu tệ H0 Bộ liệu tệ có H0 hợp lý so với liệu ta có: Nếu H0 đúng, phép thử khơng nhận loại liệu ta có p-value thể mức độ hợp lý giả thuyết null dựa liệu x1, , xn p-value nhỏ, H0 hợp lý Liên hệ với mức ý nghĩa a, xác suất xảy sai lầm loại I: Mức ý nghĩa a nhỏ đồng với quan điểm bảo vệ giả thuyết H0 Nghĩa bác bỏ giả thuyết H0 có đủ chứng sai Bác bỏ H0 p-value < a Ngược lại, chấp nhận H0 p-value > a 1.1.2 Xác định p-value Xét ví dụ tốn kiểm định phía với kỳ vọng Mức độ khơng tương thích liệu với giả thuyết null đo thống kê t t= p n (x s p-value xác suất sinh liệu với m = m0 có thống kê t có trị tuyệt đối > jtj p-value = P(X jtj) + P(X jtj) = 2P(X jtj) m0) t(n 1) Ta bác bỏ H0 p-value a Kết hợp P X ( n 1) ta ( n 1) jtj > t a = a , trở thành ( n 1) Như vậy, bác bỏ H0 khijtj > t a Nhận xét: Phương pháp thống với cách trình bày miền bác bỏ giảng Miền bác bỏ xác định theo bước sau: Chọn thống kê phù hợp biểu thị mức độ khơng tương thích liệu với giả thuyết H Xác định phân phối thống kê Dựa p-value phân phối thống kê, xây dựng miền bác bỏ 1.1.3 Mối quan hệ với khoảng tin cậy Nếu m0 nằm khoảng tin cậy với độ tin cậy g = a p-value toán kiểm định H : m = m0, H1 : m 6= m0 lớn a, nghĩa chấp nhận H0 Do đó, phương pháp khoảng tin cậy hoàn toàn cho phép kết luận chấp nhận hay bác bỏ giả thuyết H0 Thông thường, người ta hay dùng khoảng tin cậy xây dựng khoảng tin cậy a cho m có nhiều ý nghĩa kiểm định giả thuyết cớ a 1.2 Tỷ số hợp lý tổng quát Trong chương ta nghiên cứu số toán kiểm định mà nhà thống kê quan tâm giải toán thực tế Các toán dựa khái niệm tỷ số hợp lý tổng quát (generalized likelihood ratio) Đây nguyên lý quan trọng dùng để gợi ý trình kiểm định thưc tế Định nghĩa: Cho y1, , yn mẫu ngẫu nhiên với tham số q1, , qk Kí hiệu w, W không gian tham số chưa biết H đúng, không gian tất tham số chưa biết Tỷ số hợp lý tổng quát, max L(q , ,q ) w l= k max L(q1 W Ta bác bỏ H0 < l < l , l thỏa mãn P < L < l j H0 = a Sử dụng nguyên lý này, người ta xây dựng phân phối cho toán kiểm định , , qk) L =L( Chương Các toán kiểm định 2.1 Kiểm định mẫu 2.1.1 Kiểm định cho kỳ vọng Xét biến ngẫu nhiên X có kỳ vọng m phương sai s Nếu mẫu có phân phối chuẩn có cỡ đủ lớn thống kê X Z= m s p n có phân phối chuẩn tắc Trường hợp biết phương sai Kết quả: Cho y1, , yn mẫu ngẫu nhiên cỡ n có phân phối chuẩn với phương sai s biết Đặt z= m0 x s pn Kiểm định H0 : m = m0 H1 : m 6= m0 với mức ý nghĩa a, bác bỏ H0 zz z z a a Ví dụ: Một hãng bảo hiểm thông báo số tiền trung bình hãng chi trả cho khách hàng bị tai nạn ô tô 8500 USD Để kiểm tra lại, người ta kiểm tra ngẫu nhiên hồ sơ chi trả 25 khách hàng thấy số tiền trung bình chi trả 8900 USD Giả sử số tiền chi trả tuân theo luật phân phối chuẩn với độ lệch chuẩn 2600 USD Hãy kiểm định lại thông báo hãng bảo hiểm với mức ý nghĩa 5% [24]: utest = function(x_, mu, sigma, n, anpha, alternative) { u = (x_ mu )* sqrt(n)/sigma ketqua = "" if (alternative == "two.sided") { if ((u >= qt(1-anpha/2,df = n-1)) | ( u