Lý thuyết chi tiết rõ ràng và ví dụ về tất cả các dạng bài toán Xstk: Kiểm định giả thuyết thống kê dành cho sinh viên các trường đại học và cao đẳng.................................................................................
Xác suất thống kê B KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn Khoa Toán Trường Đại học Khoa Học Tự Nhiên Hồ Chí Minh Ngày tháng năm 2017 Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 / 78 Table of contents Biến cố xác suất Bài toán kiểm định giả thuyết thống kê Định nghĩa Giả thuyết không đối thuyết Cách đặt giả thuyết Miền bác bỏ - Tiêu chuẩn kiểm định Sai lầm loại I loại II p- giá trị Kiểm định giả thuyết cho trường hợp mẫu Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho tỷ lệ Kiểm định giả thuyết cho trường hợp hai mẫu độc lập So sánh hai tỷ lệ So sánh hai kỳ vọng So sánh hai kỳ vọng, TH biết phương sai So sánh hai kỳ vọng, TH phương sai, mẫu lớn So sánh hai kỳ vọng, TH phương sai, mẫu nhỏ Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 / 78 Bài toán kiểm định giả thuyết thống kê Định nghĩa Định nghĩa Ví dụ 1: Giám đốc nhà máy sản xuất bo mạch chủ máy vi tính tuyên bố tuổi thọ trung bình bo mạch chủ nhà máy sản xuất năm; giả thuyết kỳ vọng biến ngẫu nhiên X := tuổi thọ bo mạch chủ Để đưa kết luận chấp nhận hay bác bỏ giả thuyết trên, ta cần dựa vào mẫu điều tra quy tắc kiểm định thống kê Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 / 78 Bài toán kiểm định giả thuyết thống kê Định nghĩa Định nghĩa Định nghĩa Giả thuyết thống kê phát biểu tham số, quy luật phân phối, tính độc lập đại lượng ngẫu nhiên Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 / 78 Bài toán kiểm định giả thuyết thống kê Định nghĩa Định nghĩa Định nghĩa Giả thuyết thống kê phát biểu tham số, quy luật phân phối, tính độc lập đại lượng ngẫu nhiên Kiểm định giả thuyết trình mà qua định bác bỏ giả thuyết hay không, dựa vào mẫu (X1 , , Xn ) lấy từ tổng thể Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 / 78 Bài toán kiểm định giả thuyết thống kê Giả thuyết không đối thuyết Định nghĩa Định nghĩa Trong toán kiểm định giả thuyết, Giả thuyết không (null hypothesis) giả thuyết cần kiểm định Ký hiệu: H0 Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 / 78 Bài toán kiểm định giả thuyết thống kê Giả thuyết không đối thuyết Định nghĩa Định nghĩa Trong toán kiểm định giả thuyết, Giả thuyết không (null hypothesis) giả thuyết cần kiểm định Ký hiệu: H0 Đối thuyết (alternative hypothesis) giả thuyết xem xét để thay giả thuyết không Ký hiệu: H1 Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 / 78 Bài toán kiểm định giả thuyết thống kê Giả thuyết không đối thuyết Định nghĩa Định nghĩa Trong toán kiểm định giả thuyết, Giả thuyết không (null hypothesis) giả thuyết cần kiểm định Ký hiệu: H0 Đối thuyết (alternative hypothesis) giả thuyết xem xét để thay giả thuyết không Ký hiệu: H1 Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 / 78 Bài toán kiểm định giả thuyết thống kê Giả thuyết không đối thuyết Định nghĩa Định nghĩa Trong toán kiểm định giả thuyết, Giả thuyết không (null hypothesis) giả thuyết cần kiểm định Ký hiệu: H0 Đối thuyết (alternative hypothesis) giả thuyết xem xét để thay giả thuyết không Ký hiệu: H1 Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 / 78 Bài toán kiểm định giả thuyết thống kê Giả thuyết không đối thuyết Định nghĩa Xét toán kiểm định tham số, giả sử ta quan trắc mẫu ngẫu nhiên (X1 , , Xn ) từ biến ngẫu nhiên X có hàm mật độ xác suất f (x; θ) phụ thuộc vào tham số θ Gọi Θ không gian tham số, Θ0 Θc0 hai tập rời Θ cho Θ0 ∪ Θc0 = Θ Giả thuyết (giả thuyết không) đối thuyết toán có dạng sau H0 : θ ∈ Θ0 H1 : θ ∈ Θc0 Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết phân phối Kiểm định giả thuyết phân phối Thống kê kiểm định Q cho công thức k Q = i=1 (Oj − Ej )2 Ej Q xấp xỉ phân phối χ2 với k − bậc tự Bác bỏ H0 Q ≥ χ21−α,k−r −1 với r số tham số ước lượng Tìm χ21−α,k−r −1 :tra bảng Chi - bình phương Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 64 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết phân phối Kiểm định giả thuyết phân phối Ví dụ 12: Bảng thống kê số vụ tai nạn xe máy/ ngày quận thành phố 80 ngày Số vụ tai nạn Số ngày 34 25 11 Với mức ý nghĩa 5%, kiểm tra xem số vụ tai nạn xe máy hàng ngày có tuân theo luật phân phối Poisson hay không? Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 65 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết phân phối Kiểm định giả thuyết phân phối Ví dụ 13: Điểm thi 200 sinh viên lớp học cho bảng bên Có ý kiến cho điểm thi sinh viên đại lượng ngẫu nhiên có phân phối chuẩn với điểm trung bình 75 độ lệch chuẩn Với α = 0.05, kiểm tra ý kiến Điểm thi Số sinh viên (0,60] 12 (60,70] 36 (70,80] 90 (80,90] 44 (90,100] 18 Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 66 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết phân phối Kiểm định giả thuyết phân phối Ví dụ 14: Nhóm máu 500 người chọn ngẫu nhiên từ khu vực cho bảng sau: A B AB O 75 150 15 260 Theo từ điển y khoa tỷ lệ nhóm máu dân số 0.18, 0.28, 0.05, 0.49 Hỏi nhóm máu dân số có phù hợp với từ điển y khoa hay không? mức ý nghĩa 1% Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 67 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết tính độc lập Kiểm định giả thuyết tính độc lập • Bài toán: Giả sử phần tử tổng thể phân loại theo hai đặc tính khác nhau, gọi đặc tính X đặc tính Y X có r giá trị Y có s giá trị Gọi Pij = P(X = xi , Y = yj ) với i = 1, , r j = 1, , s pij xác suất chọn phần tử tổng thể có đặc tính X i đặc tính Y j Gọi s Pij , i = 1, , r pi = P(X = xi ) = j=1 r Pij , j = 1, , s qj = P(Y = yj ) = i=1 Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 68 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết tính độc lập Kiểm định giả thuyết tính độc lập pi xác suất chọn phần tử tổng thể có đặc tính X xi , qj xác suất chọn phần tử tổng thể có đặc tính Y yj , Ta cần kiểm định xem X có độc lập với Y hay không? Phát biểu gải thuyết H0 : Pij = pi qj ∀i = 1, , r ; j = 1, , s đối thuyết H1 : ∃(i, j) cho Pij = pi qj Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 69 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết tính độc lập Kiểm định giả thuyết tính độc lập Khảo sát N phần bảng ngẫu nhiên y1 x1 n11 x2 n21 xr Tổng cột nr m1 tử, ta bảng kết quả, toán gọi y2 n12 n22 ··· ··· ··· ys n1s n2s Tổng hàng n1 n2 nr m2 ··· ··· nrs ms nr N Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 70 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết tính độc lập Kiểm định giả thuyết tính độc lập Ước lượng pi qj bẳng pˆi = ni , N i = 1, , r qˆj = mj , N j = 1, , s Gọi Nij số phần tử có đặc tính (xi , yj ) N phần tử khảo sát, Nij ∼ B(N, Pij ) Khi đó, E(Nij ) = NPij = Npi qj H0 Đặt eij = N pˆi qˆj = ni mj N eij gọi tần số lý thuyết Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 71 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết tính độc lập Kiểm định giả thuyết tính độc lập Định lý (Pearson) Với Nij Eij = NPij , biến ngẫu nhiên r s i=1 j=1 (Nij − Eij )2 Eij hội tụ theo phân phối biến ngẫu nhiên Chi - bình phương χ2(r −1)(s−1) bậc tự Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 72 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết tính độc lập Kiểm định giả thuyết tính độc lập Các bước kiểm định Phát biểu giả thuyết H0 : X Y độc lập Xác định tần số thực nghiệm nij tần số lý thuyết eij = ni m j N với ni mj tổng hàng i tổng cột j tương ứng Điều kiện: eij ≥ Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 73 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết tính độc lập Kiểm định giả thuyết tính độc lập Tính thống kê kiểm định r s Q2 = i=1 j=1 (nij − eij )2 = eij r s i=1 j=1 nij2 eij −N Nếu H0 đúng, thống kê Q có phân phối Chi bình phương với (r − 1)(s − 1) bậc tự Bác bỏ H0 Q > χ2(r −1)(s−1) (1 − α) 4b Sử dụng p−giá trị: p = P(χ2(r −1)(s−1) ≥ Q Bác bỏ H0 khi: p ≤ α Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 74 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết tính độc lập Kiểm định giả thuyết tính độc lập Ví dụ 15: Một báo cáo khoa học y khoa tuyên bố việc sở hữu thú cưng nhà (chó mèo) làm tăng khả sống sót người chủ mà thường bị lên đau tim Mọt mẫu ngẫu nhiên gồm 95 người lên đau tim chọn để khảo sát Dữ liệu người khảo sát chia làm loại: ♣ Những người sống sót/tử vong năm sau lên đau tim ♣ Người sống sót/tử vong có nuôi thú cưng nhà hay không Kết cho bảng sau: Sống sót Tử vong Có nuôi thú cưng 28 Không nuôi thú cưng 44 15 Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 75 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết tính độc lập Kiểm định giả thuyết tính độc lập Phát biểu giả thuyết H0 : Bệnh lên đau tim độc lập với việc nuôi thú cưng Tính tần số thực nghiệm: với n1 = 72, n2 = 23, m1 = 36, m2 = 59 e11 = 72 × 36 n1 m2 72 × 59 n1 m1 = = 27.284; e12 = = = 44.716 N 95 N 95 e21 = n2 m1 23 × 36 n2 m2 23 × 59 = = 8.716; e22 = = = 14.284 N 95 N 95 Tính giá trị thống kê Q 2 2 Q = i=1 j=1 nij2 eij −n = 282 442 82 152 + + + −95 = 0.1 27.284 44.716 8.716 15.284 Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 76 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết tính độc lập Kiểm định giả thuyết tính độc lập Bác bỏ H0 khi: Q > χ2(r −1)(s−1) (1 − α) = χ21 (1 − 0.05) Tra bảng Chi-bình phương, ta χ21 (0.95) = 3.841 Q = 0.125, suy Q < 3.841 Ta kết luận chưa đủ sở để bác bỏ H0 tức bệnh lên đau tim độc lập với việc nuôi thú cưng Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 77 / 78 Kiểm định Chi bình phương Kiểm định giả thuyết tính độc lập Kiểm định giả thuyết tính độc lập Ví dụ 16: Vé máy bay hãng hàng không Việt Nam Airline chia làm loại: Hạng thường (C), hạng trung (B) hạng doanh nhân (A) Hành khách máy bay VN Airlines nằm trong dạng sau: bay nội địa quốc tế Khảo sát 920 hành khách bay hãng, cho kết sau: Loại vé Hạng thường Hạng trung Hạng doanh nhân Loại chuyến bay Nội địa Quốc tế 29 22 95 121 518 135 Có ý kiến cho hành khách mua loại vé (A, B, C) phụ thuộc vào việc người bay nội địa hay quốc tế Với mức ý nghĩa 5%, kiểm tra ý kiến Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn XSTKB ( ĐHKHTN) Ngày tháng năm 2017 78 / 78