Bài giảng Thống kê ứng dụng trong kinh doanh Chương 10: Kiểm định phi tham số cung cấp cho người học các kiến thức: Kiểm định dấu và hạng Wilcoxon về trung vị của một tổng thể, kiểm định dấu và hạng Wilcoxon trên 2 tổng thể trường hợp lấy mẫu cặp, KĐ Kruskal Wallism,... Mời các bạn cùng tham khảo nội dung chi tiết.
CHƯƠNG 10 KIỂM ĐỊNH PHI THAM SỐ Ths Nguyễn Tiến Dũng Viện Kinh tế Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn CÁC NỘI DUNG CHÍNH 10.1 KĐ dấu hạng Wilcoxon trung vị tổng thể 10.2 KĐ dấu hạng Wilcoxon tổng thể, trường hợp lấy mẫu cặp 10.3 KĐ tổng hạng Wilcoxon tổng thể, trường hợp lấy mẫu độc lập 10.4 KĐ Kruskal - Wallis 10.5 KĐ Chi bình phương mối liên hệ hai biến định tính 10.6 KĐ Chi bình phương mẫu © Nguyễn Tiến Dũng Thống kê ứng dụng 10.1 KĐ dấu hạng Wilcoxon trung vị tổng thể Gọi trung vị tổng thể M, giá trị cần so sánh M0 ● B1: Lập giả thuyết ● B2: Lựa chọn mức ý nghĩa α ● B3: Tính chênh lệch di: 𝑑𝑖 = 𝑥𝑖 − 𝑀0 ● B4: Loại bỏ di = 0, tính giá trị tuyệt đối chênh lệch |di| xếp hạng |di| H0 : M M H1 : M M ● |di| nhỏ có hạng ● Nếu có hạng ngang tính hạng TB ● Cỡ mẫu rút gọn n’ = n – số trường hợp có di ● B5: Tách hạng vừa xếp thành cột ● Nếu di > đặt vào cột R+ ● Nếu di < đặt vào cột R© Nguyễn Tiến Dũng Thống kê ứng dụng Quan điểm 1: SGK ● B6: Tính tiêu KĐ ● Nếu n’ ≤ 20, tiêu KĐ W ● KĐ bên: W = min(ΣR+; ΣR-) ● KĐ bên phải: W = ΣR+ ● KĐ bên trái: W =ΣR- ● Nếu n’ > 20, tiêu KĐ z ● B7: Bác bỏ H0 ● Nếu n’ ≤ 20: W < WL ● Nếu n’ > 20: z W W W n '.( n ' 1) W n '.( n ' 1).(2 n ' 1) W2 24 ● KĐ bên: z < -zα ● KĐ bên: z < -zα/2 © Nguyễn Tiến Dũng Thống kê ứng dụng W W Quan điểm (khuyên dùng) z ● B6: Tính tiêu KĐ, W ● Nếu n’ ≤ 20, tiêu KĐ W = ΣR+ ● Nếu n’ > 20, tiêu KĐ z W2 W n '.( n ' 1) n '.( n ' 1).(2 n ' 1) 24 ● B7: Bác bỏ H0 ● Nếu n’ ≤ 20, tra bảng tìm WL (cận dưới) WU (cận trên) ● Nếu KĐ bên: Bác bỏ H0 W < WL W > WU ● Nếu KĐ bên trái: Bác bỏ H0 W < WL ● Nếu KĐ bên phải: Bác bỏ H0 W > WU ● Nếu n’ > 20, bác bỏ H0 ● KĐ bên trái: z < -zα ● KĐ bên phải: z > zα ● KĐ bên: z < -zα/2 z > zα/2 © Nguyễn Tiến Dũng Thống kê ứng dụng Wilcoxon Signed-Rank Test Table © Nguyễn Tiến Dũng Thống kê ứng dụng 10.2 KĐ tổng hạng Wilcoxon TB mẫu độc lập ● B1: Chọn mẫu làm Mẫu (n1 10 n2 > 10) tiêu KĐ z z ● B4: Bác bỏ H0 n1n2 ( n 1) 12 T1 T1 T ● Nếu cỡ mẫu nhỏ: ● KĐ bên: T1 > WU T1 < WL ● KĐ bên trái: T1 < WL ● KĐ bên phải: T1 > WU ● Nếu cỡ mẫu lớn: KĐ bên trái: z < -zα; KĐ bên phải: z > zα; KĐ hai bên: z < -zα/2 z > zα/2 © Nguyễn Tiến Dũng Thống kê ứng dụng 10.3 KĐ dấu hạng Wilcoxon với mẫu cặp ● B1: Xác định chênh lệch di = x1i – x2i lập cặp giả thuyết KĐ H0 : M1 M H1 : M M H0 : M1 M H1 : M M H0 : M1 M H1 : M M H0 : M D H1 : M D H0 : M D H1 : M D H0 : M D H1 : M D © Nguyễn Tiến Dũng Thống kê ứng dụng ● B2: Xác định giá trị tuyệt đối |di| ● B3: Loại bỏ |di| 0, hạng |di| từ nhỏ tới lớn Giá trị |di| nhỏ có hạng Nếu có nhiều |di| nhau, tính hạng trung bình ● n’ = n – số trường hợp có di = ● B4: Tách riêng hạng |di| thành loại, hạng R+ hạng R- theo dấu di gốc Nếu di> 0, xếp vào cột R+ Nếu di < 0, xếp vào cột R- ● B5: Tính giá trị KĐ W = Ri+ ● B6: Áp dụng quy tắc bác bỏ H0 ● Nếu n’ ≤ 20 ● KĐ bên trái: W < WL ● KĐ hai bên: W ≤ WL W ≥ WU ● KĐ bên phải: W ≥ WU © Nguyễn Tiến Dũng Thống kê ứng dụng 10 ● Nếu n’ > 20 W xấp xỉ PP bình thường Khi biến đổi chuẩn hoá W kiểm định theo tiêu z ● Quy tắc bác bỏ H0 tương tự toán KĐ TB tổng thể, trường hợp biết W W z © Nguyễn Tiến Dũng n '( n ' 1) n '( n ' 1)(2 n ' 1) 24 W W W Thống kê ứng dụng 11 10.4 KĐ Kruskal – Wallis nhiều mẫu độc lập ● Mục đích: so sánh TB k mẫu độc lập (k >2) ● Gọi n = n1 + n2 + … + nk ● H0: M1 = M2 = … = Mk ● Chỉ tiêu KĐ W ● Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng k 12 Ri2 W 3( n 1) n ( n 1) i 1 ni Baùc boû H neáu W> k21; Thống kê ứng dụng 12 10.5 KĐ Chi bình phương mối liên hệ biến định tính ● Biến 1: Biến hàng ● Biến 2: Biến cột ● Lập bảng tần số kết hợp biến ● Tại ô mà có hàng i cột j -> tính tần số thực Oij ● Tính tổng theo hàng Ri tổng theo cột Cj ● Tính tần số kỳ vọng Eij = Ri x Cj / n ● Tính (Oij – Eij)2/Eij -> tổng lại Chi-square ● Bác bỏ H0 theo tiêu đánh giá Chi-square © Nguyễn Tiến Dũng Thống kê ứng dụng 13 Ngắn TB Dài Tổng hàng H.phúc O11=38 E11 = 45 O12 = 58 E12 = 60 O13 = 54 E13 = 45 R1 = 150 Không HP O21 = 12 E21 = O22 = 14 E22 = 12 O23 = E23 = R2 = 30 Ly dị / Ly thân O31 = 10 E31 = O32 = E32 = O33 = E33 = R3 = 20 C1 = 60 C2 = 80 C3 = 60 n = 200 Eij Ri C j n r c (Oij Eij ) i 1 j 1 Eij Baùc boû H neáu df2 ; df ( r 1).( c 1) © Nguyễn Tiến Dũng Thống kê ứng dụng 14 ij Oij Eij Oij-Eij (Oij-Eij)2 11 38 45 -7 49 1,0889 12 58 60 -2 0,0667 13 54 45 81 1,8000 21 12 9 1,0000 22 14 12 0,3333 23 -5 25 2,7778 31 10 -4 16 2,6667 32 8 0 33 -4 16 Tổng 200 Chi-square tính = 12,4 Chi-square tra bảng (df = x = 4; alpha = 0,05) = 9,4877 Bác bỏ Ho © Nguyễn Tiến Dũng Thống kê ứng dụng (Oij-Eij)2/Ei 2,6667 12,4000 15 10.6 KĐ Chi bình phương phù hợp ● Goodness-of-fit Test ● Mục đích: Kiểm tra phân phối tần số có phù hợp với tần số lý thuyết hay không ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0 Stat (Oi Ei ) Ei i 1 k Baùc boû H neáu Stat df ; df k © Nguyễn Tiến Dũng Thống kê ứng dụng 16 (Oi-Ei)2 (Oi-Ei)2/Ei i Thứ Oi Ei Oi-Ei Hai 5,333 1,667 2,7889 0,5211 Ba 5,333 -2,333 5,4289 1,0206 Tư 5,333 -2,333 5,4289 1,0206 Năm 5,333 -3,333 11,0889 2,0830 Sáu 5,333 -0,333 0,1089 0,0208 Bảy 12 5,333 6,667 44,4889 8,3347 Tổng © Nguyễn Tiến Dũng 32 13,0008 Thống kê ứng dụng 17