1 NGUYÊN LÝ THỐNG KÊ KINH TẾ ThS. Hứa Thanh Xuân Phần dành cho đơn vị 98 CHƯƠNG 8: KIỂM ĐỊNH PHI THAM SỐ • Điều kiện áp dụng: - Không đòi hỏi phân phối tổng thể là chuẩn. - D ữ liệu ở dạng tần số hoặc số đếm. • Các dạng kiểm định phi tham số: – Kiểm định Wilcoxon (Kiểm định T). – Ki ểm định Mann-Whitney. – Ki ểm định Kruskal – Wallis. – Ki ểm định sự phù hợp. – Ki ểm định sự độc lập. 99 KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T) (So sánh TB 2 tổng thể-Phương pháp so sánh cặp) • Trường hợp mẫu nhỏ: n 20 Bước 1: Đặt giả thuyết: Bước 2: Tính giá trị kiểm định: - Tính s ự chênh lệch giữa các cặp: di = xi – yi - X ếp hạng các dI trong giá trị tuyệt đối di - Tìm t ổng hạng của di mang dấu dương + và t ổng hạng của di mang dấu âm -. - Giá tr ị kiểm định (T): T = min ( + ; -). Bước 3: Điều kiện bác bỏ H 0 : T < T n; 0: 0: 2 1 2 1 10 H H 2 100 KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T) (So sánh TB 2 tổng thể-Phương pháp so sánh cặp) Ví dụ 8.1: Trong tháng trước và sau Noel, số lượng người mua sắm quần áo tại 11 cửa hàng trong thành ph ố như sau: 971455570891057558309550Sau Noel 9715060728911585463010556 Trước Noel 1110987654321 C ửa hàng Với mức ý nghĩa 5%, hãy kiểm định xem số lượt người mua sằm quần áo trước và sau Noel có thực s ự khác nhau không? 101 • Trường hợp mẫu lớn: n > 20 Bước 1: Đặt giả thuyết: có thể đặt ở dạng 1 đuôi hoặc 2 đuôi. Bước 2: Giá trị kiểm định: Bước 3: Bác bỏ H 0 khi: - Ki ểm định dạng “1 đuôi”: Z < - Z - Kiểm định dạng “2 đuôi”: Z < - Z/2. KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T) (So sánh TB 2 tổng thể-Phương pháp so sánh cặp) T T T Z 4 1)n(n T 24 121 2 )n)(n(n T Với 102 KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U) (So sánh TB 2 tổng thể-Phương pháp độc lập) 1. Trường hợp mẫu nhỏ: n 1 , n 2 10; n 1 < n 2 Bước 1: Đặt giả thuyết: như các trường hợp trên Bước 2: Tính giá trị kiểm định: - X ếp hạng tất cả các giá trị của 2 mẫu theo thứ tự tăng dần. Nh ững giá trị bằng nhau sẽ nhận giá trị trung bình - C ộng các hạng của tất cả các giá trị ở mẫu thứ nhất, ký hi ệu là R1. - Giá tr ị kiểm định: Bước 3: Tra bảng phân phối để tìm F (U) = F n1,n2 (U) Bước 4: Giả thuyết H 0 bị bác bỏ khi: > p = 2 F(U). Lưu ý: 2 ) 1 n ( n R 1 11 21 2 1 R )n(n nnU 3 103 Ví dụ 8.2: Chúng ta muốn so sánh lương khởi điểm c ủa sinh viên tốt nghiệp ở ngành kinh tế với điện tử tin h ọc được trả bởi các công ty như sau: (100.000đ) Có th ể kết luận tiền lương khởi điểm của 2 nhóm là khác nhau không? 22251814302812242217Kinh t ế 2430271815Điện tử tin học KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U) (So sánh TB 2 tổng thể-Phương pháp độc lập) 104 2. Trường hợp mẫu lớn: n1, n2 > 10 211 210 :H :H 211 210 :H :H 211 210 :H :H U U U Z 2 21 n n U 12 1 2121 2 )nn(nn U ; Bác bỏ H 0 GTKĐ Đặt giả thuyết 2 đuôi1 đuôi trái1 đuôi phải Với KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U) (So sánh TB 2 tổng thể-Phương pháp độc lập) | Z |> Z | Z |> Z/2 105 Ví dụ 8.3: Trở lại vấn đề tiền lương khởi điểm c ủa hai ngành kinh tế và điện tử tin học. Mỗi ngành ch ọn ngẫu nhiên 80 sinh viên và sau đó ti ền lương được xếp hạng từ nhỏ đến lớn, và t ổng cộng hạng được xếp cho tiền lương của ngành kinh t ế bằng 7.287. KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U) (So sánh TB 2 tổng thể-Phương pháp độc lập) 4 106 KIỂM ĐỊNH KRUSKAL WALLIS (So sánh TB nhi ều tổng thể) Bước 1: Đặt giả thuyết H 0 : Trung bình của k tổng thể thì giống nhau. H 1 : Trung bình của k tổng thể thì khác nhau. Bước 2: Xếp hạng tất cả các giá trị quan sát của k mẫu theo th ứ tự tăng dần. Những giá trị bằng nhau sẽ nhận giá tr ị trung bình. Bước 3: Cộng các hạng của tất cả các giá trị ở từng mẫu l ại, ký hiệu là R 1 , R 2 , …, R k (Lưu ý: ∑R = [n*(n+1)] / 2). Bước 4: Giá trị kiểm định: Bước 5: Bác bỏ H 0 nếu k 1i i 2 i )1n(3 n R )1n(*n 12 W 2 ;1k W 107 Ví dụ 8.4: Để so sánh chi phí quảng cáo trên 4 tờ báo khác nhau (v ới điều kiện nội dung quảng cáo là như nhau), người ta l ấy mẫu trên các tờ báo và thu được các kết quả sau (đơn vị: ngàn đồng) Báo A: 57 65 50 45 70 62 68. Báo B: 72 81 64 55 75. Báo C: 35 42 58 46 59 60 61 38. Báo D: 73 92 68 85 82 94 62. Yêu c ầu: hãy kiểm định có sự khác biệt về chi phí qu ảng cáo giữa các tờ báo nói trên hay không ở mức ý ngh ĩa 5%. KIỂM ĐỊNH KRUSKAL WALLIS (So sánh TB nhi ều tổng thể) 108 KIỂM ĐỊNH SỰ PHÙ HỢP • Bài toán tổng quát: Giả sử có mẫu ngẫu nhiên n quan sát, được chia thành k nhóm khác nhau: m ỗi quan sát ph ải và chỉ thuộc về một nhóm thứ i nào đó ( i = 1,2, … , k). G ọi Oi là số lượng quan sát ở nhóm thứ i. Ki ểm định giả thuyết H 0 về phân phối của tổng th ể (hay giả thuyết H 0 thể hiện các xác suất p i để một quan sát nào đó thuộc về nhóm thứ i. 5 109 Bước 1: Tính số lượng quan sát thuộc về nhóm thứ i trong trường hợp gi ả thuyết H 0 đúng, nghĩa là tính các giá trị mong muốn E i - theo công th ức: E i = np i (Ei 5). n 1 n O i p i E i = np i … … … O 2 p 2 E 2 = np 2 O 1 p 1 E 1 = np 1 Giá trị thực tế (O i ) XS theo gi ả thuyết H 0 ( p i ) Giá tr ị mong muốn (E i ) k…21Nhóm KIỂM ĐỊNH SỰ PHÙ HỢP Bước 2: Tính giá trị kiểm định: k i i ii E )EO( 1 2 2 Bước 3: Bác bỏ giả thuyết H 0 khi: 2 1 2 ,k 110 KIỂM ĐỊNH SỰ PHÙ HỢP • Ví dụ 8.5 (bài tổng hợp 6): 18031296654Số lượng khách ch ọn (người) T ổngLgSony Ericsson SamsungNokiaNhãn hiệu Với mức ý nghĩa 5%, có thể kết luận sở thích của người tiêu dùng đối với 4 nhãn hiệu điện thoại di động trên là khác nhau hay không? 111 KIỂM ĐỊNH SỰ ĐỘC LẬP Bài toán tổng quát: • Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân nhóm k ết hợp 2 tiêu thức với nhau, hình thành nên bảng ti ếp liên gồm r hàng (row) và c cột (column). • G ọi Oij là số quan sát ứng với hàng thứ i và cột thứ j . • Ri là t ổng số quan sát ở hàng thứ i . • Cj là t ổng số quan sát ở cột thứ j . nC c ……C 2 C 1 RrO rc ……O r2 O r1 r ………………… R2O 2c ……O 22 O 21 2 R1O 1c ……O 12 O 11 1 c……21 Phân nhóm theo tiêu th ức thứ 1Phân nhóm theo tiêu th ức thứ 2 6 112 KIỂM ĐỊNH SỰ ĐỘC LẬP - Bước 1: Đặt giả thuyết H 0 : Không có mối liên hệ giữa 2 tiêu thức. H 1 : Tồn tại mối liên hệ giữa 2 tiêu thức. - Bước 2: Tính số lượng quan sát theo giả thuyết H 0 - Bước 3: Tính GTKĐ: - Bước 4: Bác bỏ H 0 nếu : V ới có phân phối 2 với (r-1) (c-1) bậc tự do. n C R n R CE jjj jij r 1i c 1j ij 2 ijij 2 E )EO( 2 11 2 ),c)(r( 113 KIỂM ĐỊNH SỰ ĐỘC LẬP 32066131123 170318455Nữ 150354768Nam 7 UpPepsiCoca - Cola Nhãn hi ệu ưa thích Gi ới tính Ví dụ 8.6: Với α = 5%, có thể kết luận có mối liên hệ giữa nhãn hi ệu ưa thích và giới tính hay không? . dạng tần số hoặc số đếm. • Các dạng kiểm định phi tham số: – Kiểm định Wilcoxon (Kiểm định T). – Ki ểm định Mann-Whitney. – Ki ểm định Kruskal – Wallis. – Ki ểm định sự phù hợp. – Ki ểm định sự. 1 NGUYÊN LÝ THỐNG KÊ KINH TẾ ThS. Hứa Thanh Xuân Phần dành cho đơn vị 98 CHƯƠNG 8: KIỂM ĐỊNH PHI THAM SỐ • Điều kiện áp dụng: - Không đòi hỏi phân. hoặc 2 đuôi. Bước 2: Giá trị kiểm định: Bước 3: Bác bỏ H 0 khi: - Ki ểm định dạng “1 đuôi”: Z < - Z - Kiểm định dạng “2 đuôi”: Z < - Z/2. KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T) (So sánh TB 2 tổng