XSTK Ứng Dụng Trong Kinh Tế - TLU and maths ď Chuong10_HO

24 214 1
XSTK Ứng Dụng Trong Kinh Tế - TLU and maths ď Chuong10_HO

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

CHƯƠNG 10: KIỂM ĐỊNH PHI THAM SỐ Trần Minh Nguyệt Đại học THĂNG LONG Tháng năm 2014 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 71 Nội dung Giới thiệu kiểm định phi tham số Kiểm định cho trung vị tổng thể Kiểm định dấu trung vị tổng thể Kiểm định trung vị tổng thể R Kiểm định tổng hạng Wilcoxon cho trung vị hai mẫu độc lập Kiểm định dấu hạng Wilcoxon cho hai trung vị, chọn mẫu theo đôi Kiểm định trung vị hai tổng thể R Kiểm định Kruskal Wallis cho nhiều mẫu độc lập Kiểm định Chi - bình phương tính độc lập Kiểm định chi - bình phương phù hợp Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 71 Giới thiệu kiểm định phi tham số Kiểm định phi tham số Trong phân tích liệu khơng phải lúc bạn gặp tình thỏa mãn hoàn toàn giả định cần thiết cho kiểm định nghiên cứu (kiểm định cho trung bình tổng thể, phân tích phương sai), đặc biệt bạn có mẫu nhỏ Lúc bạn phải dùng phép kiểm định đòi hỏi giả thiết nghiêm ngặt phân phối tổng thể, kiểm định gọi kiểm định với phân phối hay gọi kiểm định phi tham số Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 71 Giới thiệu kiểm định phi tham số Kiểm định phi tham số Ưu điểm: Không đòi hỏi giả định tham số phân phối tổng thể Một số phép kiểm định phi tham số dùng cho liệu định danh thứ bậc Những tính tốn kiểm định phi tham số phức tạp kiểm định tham số, đặc biệt mẫu cỡ nhỏ Những kết luận đưa tốt trường hợp mẫu có giá trị ngoại biên Nhược điểm Khả tìm sai biệt thực giả định tốn kiểm định tham số thỏa mãn Khó mở rộng sang phương pháp thống kê cao cấp kiểm định tham số Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 71 Kiểm định cho trung vị tổng thể Kiểm định cho trung vị tổng thể Trong chương 8, ta biết toán kiểm định cho trung bình tổng thể thực tổng thể tuân theo phân phối chuẩn cỡ mẫu lớn (¥ 30) Khi cỡ mẫu nhỏ tổng thể khơng tn theo phân phối chuẩn khơng thực tốn kiểm định cho trung bình tổng thể Trung bình trung vị số đo độ tập trung tổng thể Tuy nhiên, tổng thể có phân phối lệch phải lệch trái trung vị số đo độ tập trung tốt trung bình Kiểm định cho trung vị thực tổng thể khơng có phân phối chuẩn cỡ mẫu nhỏ Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 / 71 Kiểm định dấu trung vị tổng thể Kiểm định dấu trung vị Gọi Md trung vị tổng thể Ta có tốn kiểm định sau: Bi toỏn H0 : Md = (Ô)M0 H1 : Md ¡ M0 Bài toán H0 : Md = (¥)M0 H1 : Md   M0 Bài tốn Md = M0 H1 : Md  M0 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 71 Kiểm định cho trung vị tổng thể Kiểm định dấu trung vị tổng thể Các bước thực Thu thập thơng tin mẫu Tính tốn chênh lệch di giá trị quan sát giá trị trung vị giả thuyết Lấy trị tuyệt đối chênh lệch Xếp hạng cho |di |, quy ước giá trị |di | nhỏ có hạng 1, di = khơng tham gia vào q trình xếp hạng Nếu |di | có giá trị ngang tính hạng trung bình cho tất quan sát có giá trị |di | Với giá trị lớn trung vị giả thuyết đặt hạng vào cột ký hiệu R+, với giá trị nhỏ trung vị giả thuyết đặt hạng vào cột ký hiệu R Giá trị thống kê W tính tổng hạng cột R+ So sánh giá trị thống kê W với giá trị tới hạn đưa quy luật định toán Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 / 71 Kiểm định dấu trung vị tổng thể Ví dụ Giám đốc trung tâm hỗ trợ việc làm trường đại học muốn làm nghiên cứu lương sinh viên tốt nghiệp sau hai năm làm việc khu vực có vốn đầu tư nước ngồi Ơng ta thu thập liệu lương 10 sinh viên sau: 364 385 270 350 290 400 520 340 389 410 Ông ta tin phân phối tổng thể lệch phải Vì ơng giám đốc dùng kiểm định Wilcoxon dấu trung vị Ở mức ý nghĩa 5%, ơng ta kết luận trung vị thu nhập sinh viên tốt nghiệp sau hai năm làm việc khu vực có vốn đầu tư nước ngồi 350$/tháng hay khơng? Lời giải:Gọi Md trung vị thu nhập sinh viên tốt nghiệp sau hai năm làm việc khu vực có vốn đầu tư nước ngồi H0 : Md Ô 350, H1 : Md Ă 350 Trn Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 / 71 Kiểm định dấu trung vị tổng thể Ví dụ Số liệu phân tích tập hợp bảng sau: Lương Xi 364 385 270 350 290 400 520 340 389 410 Tổng di = Xi  350 14 35 -80 -60 50 170 -10 39 60 | di | 14 35 80 60 50 170 10 39 60 Hạng Xác suất thống kê ứng dụng kinh tế xã hội R 6.5 6.5 Trần Minh Nguyệt (ĐH THĂNG LONG) R+ 6.5 6.5 29.5 15.5 Tháng năm 2014 / 71 Kiểm định cho trung vị tổng thể Kiểm định dấu trung vị tổng thể Ví dụ Giá trị thống kê W = 29.5 Ta có n = (số lượng di khác không), α = 0.05 ta giá trị tới hạn 37 Vì W = 29.5   37 nên ta không bác bỏ H0 Vậy mức ý nghĩa 5%, ông giám đốc kết luận trung vị thu nhập sinh viên tốt nghiệp sau hai năm làm việc khu vực có vốn đầu tư nước ngồi 350$/tháng Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 10 / 71 Kiểm định dấu trung vị tổng thể Chú ý Giá trị kiểm định W xấp xỉ phân phối chuẩn cỡ mẫu n ¡ 20 Khi kiểm định Wilcoxon thực thơng qua: Giá trị kiểm định z: z= c n(n + 1) n(n + 1)(2n + 1) 24 W đó, W tổng hạng cột R+, n số giá trị di khác không Giá trị tới hạn zα zα/2 tùy toán Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 11 / 71 Kiểm định dấu trung vị tổng thể Ví dụ Một báo đánh giá 50% hộ Penthouse thành phố có giá nhỏ 176.2 (nghìn USD) Người ta tiến hành khảo sát mẫu ngẫu nhiên gồm 25 hộ Penthouse để kiểm chứng thông tin Chọn mức ý nghĩa 1%, kết luận đánh giá báo Lời giải: Gọi Md trung vị giá hộ Penthouse thành phố H0 : Md = 176.2, H1 : Md  176.2 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 12 / 71 Kiểm định cho trung vị tổng thể Kiểm định dấu trung vị tổng thể Ví dụ Lập bảng tương tự ví dụ ta có W = 70 Giá trị kiểm định: z= c n(n + 1) = n(n + 1)(2n + 1) 24 W c 25(25 + 1) = 2.49 25(25 + 1)(2  25 + 1) 24 70  zα/2 = z0.005 = 2.58 Vì |z| = 2.49   zα/2 = 2.58 nên ta chấp nhận H0 Ở mức ý nghĩa 5% Giá trị tới hạn ta kết luận đánh giá báo Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 13 / 71 Kiểm định trung vị tổng thể R Kiểm định trung vị tổng thể R Để kiểm định trung vị tổng thể R dùng lệnh: wilcox.test(x, mu = , alternative = ) Trong đó: x: Véc tơ liệu mu: Giá trị M0 H0 alternative: Mô tả giả thuyết đối H1 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 14 / 71 Kiểm định trung vị tổng thể R Ví dụ Thực lại Ví dụ 1, sử dụng phần mềm R: Giám đốc trung tâm hỗ trợ việc làm trường đại học muốn làm nghiên cứu lương sinh viên tốt nghiệp sau hai năm làm việc khu vực có vốn đầu tư nước ngồi Ơng ta thu thập liệu lương 10 sinh viên sau: 364 385 270 350 290 400 520 340 389 410 Ông ta tin phân phối tổng thể lệch phải Vì ơng giám đốc dùng kiểm định Wilcoxon dấu trung vị Ở mức ý nghĩa 5%, ơng ta kết luận trung vị thu nhập sinh viên tốt nghiệp sau hai năm làm việc khu vực có vốn đầu tư nước ngồi 350$/tháng hay khơng? Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 15 / 71 Kiểm định cho trung vị tổng thể Kiểm định trung vị tổng thể R Lời giải Gọi Md trung vị thu nhập sinh viên tốt nghiệp sau hai năm làm việc khu vực có vốn u t nc ngoi H0 : Md Ô 350, H1 : Md ¡ 350 Vì p-giá trị=0.2204 ¡ α = 0.05 nên ta chấp nhận H0 Vậy mức ý nghĩa 5%, ông giám đốc kết luận trung vị thu nhập sinh viên tốt nghiệp sau hai năm làm việc khu vực có vốn đầu tư nước 350$/tháng Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 16 / 71 Kiểm định trung vị tổng thể R > ThuNhap = c(364, 385, 270, 350, 290, 400, 520, 340, 389, 410) > wilcox.test(ThuNhap, alt = "g", mu = 350) Wilcoxon signed rank test with continuity correction data: ThuNhap V = 29.5, p-value = 0.2204 alternative hypothesis: true location is greater than 350 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 17 / 71 Kiểm định trung vị tổng thể R Ví dụ Thực lại Ví dụ 2, sử dụng phần mềm R: Một báo đánh giá 50% hộ Penthouse thành phố có giá nhỏ 176.2 (nghìn USD) Người ta tiến hành khảo sát mẫu ngẫu nhiên gồm 25 hộ Penthouse để kiểm chứng thông tin Chọn mức ý nghĩa 1%, kết luận đánh giá báo Lời giải: Gọi Md trung vị giá hộ Penthouse thành phố H0 : Md = 176.2, H1 : Md  176.2 p-giá trị= 0.01145 ¡ α = 0.01 nên ta chấp nhận H0 Ở mức ý nghĩa 5% ta kết luận đánh giá báo Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 18 / 71 Kiểm định cho trung vị tổng thể Kiểm định trung vị tổng thể R > Gia=c(173, 169.9, 163.5, 160.6, 159.2, 157.2, 156.5, 155.4, 155.2, 197.75, 154.2, 200.75, 149.5, 203, 204.9, 145.9, 143.5, 137.65, 216.25, 134.5, 128.9, 117, 112.4, 104.5, 102.6) > wilcox.test(Gia, mu =176.2 , alt="t") Wilcoxon signed rank test data: Gia V = 70, p-value = 0.01145 alternative hypothesis: true location is not equal to 176.2 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 19 / 71 Kiểm định tổng hạng Wilcoxon cho trung vị hai mẫu độc lập Kiểm định tổng hạng Wilcoxon cho trung vị hai mẫu độc lập Ta xét ba toán sau: Bài toán H : M1 Ô M2 H : M1 ¡ M2 Bài toán H : M1 ¥ M2 H : M1   M2 Bài toán H : M1 = M2 H0 : M1  M2 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 20 / 71 Kiểm định tổng hạng Wilcoxon cho trung vị hai mẫu độc lập Kiểm định tổng hạng wilcoxon Để tiến hành kiểm định, khơng tổng qt ta coi mẫu có cỡ nhỏ hai mẫu, hai mẫu có cỡ lấy mẫu làm mẫu Gộp hai mẫu từ hai tổng thể xếp quan sát theo thứ tự tăng dần, quan sát nhỏ có hạng 1, quan sát có hạng 2, Những trường hợp đồng hạng thay hạng trung bình Tính tổng hạng T1 mẫu 1, tổng hạng T2 mẫu Ta so sánh T1 với giá trị tới hạn để định bác bỏ hay chấp nhận H0 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 21 / 71 Kiểm định cho trung vị tổng thể Kiểm định tổng hạng Wilcoxon cho trung vị hai mẫu độc lập Ví dụ Để kiểm định tác động việc trưng bày đến doanh số, người ta chọn hai mẫu ngẫu nhiên, mẫu thứ gồm 10 gian hàng trưng bày bình thường, mẫu thứ hai gồm 10 gian hàng trưng bày đặc biệt, ghi chép doanh số gian hàng mẫu ta bảng sau Tại mức ý nghĩa 5% so sánh doanh số bán hai tuần Tuần trưng bày bình thường Tuần trưng bày đặc biệt 22 34 52 62 30 40 64 84 56 59 52 72 76 54 67 83 66 90 77 84 Lời giải: Gọi M1 , M2 trung vị doanh số bán hàng tuần trưng bày đặc biệt tuần trưng bày bình thường H0 : M1 = M2 H1 : M1  M2 Coi mẫu tuần trưng bày đặc biệt mẫu Sắp xếp phần tử mẫu gộp, tính tổng hạng riêng mẫu ta thu bảng sau: Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 22 / 71 Kiểm định tổng hạng Wilcoxon cho trung vị hai mẫu độc lập Ví dụ Doanh số tuần trưng bày đặc biệt 52 71 76 54 67 83 66 90 77 84 Tổng Hạng 5.5 14 15 13 17 12 20 16 18.5 138 Doanh số tuần trưng bày bình thường 22 34 52 62 30 40 64 84 56 59 Trần Minh Nguyệt (ĐH THĂNG LONG) Hạng 5.5 10 11 18.5 72 Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 23 / 71 Kiểm định tổng hạng Wilcoxon cho trung vị hai mẫu độc lập Ví dụ Tra bảng cặp giá trị tới hạn 78, 132 Do T1 = 138 ¡ 132 nên ta bác bỏ H0 , tức có chứng thống kê khác biệt doanh số bán hai cách trưng bày Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 24 / 71 Kiểm định cho trung vị tổng thể Kiểm định tổng hạng Wilcoxon cho trung vị hai mẫu độc lập Chú ý c Nếu cỡ mẫu n1 , n2 ¡ 10 T1 xấp xỉ phân phối chuẩn với trung bình n1 (n1 + n2 + 1) n1 n2 (n1 + n2 + 1) µT1 = độ lệch chuẩn σT1 = Từ 12 T1  µT1 giá trị chuẩn hóa xác định theo cơng thức z = Quy σT luật định trường hợp là: Bài toán 1: bác bỏ H0 z ¡ zα Bài toán 2: Bác bỏ H0 z   zα Bài toán 3: Bác bỏ H0 |z| ¡ zα/2 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 25 / 71 Kiểm định dấu hạng Wilcoxon cho hai trung vị, chọn mẫu theo Kiểm định cho trung vị tổng thể đôi Kiểm định dấu hạng Wilcoxon cho hai trung vị, chọn mẫu theo đôi Gọi M1 , M2 trung vị hai tổng thể Ta có ba tốn kiểm định sau: Bài toán H : M1  M2 Ô H : M1  M2 ¡ Bài toán H0 : M1  M2 ¥ H0 : M1  M2   Bài toán H0 : M1  M2 = H0 : M1  M2  Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 26 / 71 Kiểm định dấu hạng Wilcoxon cho hai trung vị, chọn mẫu theo Kiểm định cho trung vị tổng thể đôi Các bước thực Giả sử mẫu chọn gồm n cặp (x1 , y1 ), (x2 , y2 ), , (xn , yn ) Tính khác biệt cho cặp quan sát di = xi  yi , i = 1, 2, , n Xác định trị tuyệt đối |di |, i = 1, 2, , n Xác định cỡ mẫu thực tế n = n  {số chênh lệch = 0} Sắp hạng từ đến n cho |di |, |di | nhỏ mang hạng 1, |di| giá trị hạng chúng trung bình hạng Tách riêng hạng mang dấu dương (+) dấu âm (-) theo dấu di Tính tổng hạng W riêng cho chênh lệch dương, tổng W giá trị thống kê kiểm định Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 27 / 71 Kiểm định dấu hạng Wilcoxon cho hai trung vị, chọn mẫu theo Kiểm định cho trung vị tổng thể đôi Các bước thực Quy luật định mức ý nghĩa α Nu c mu nh n Ô 20, ta tỡm giỏ trị tới hạn, so sánh với W kết luận Nếu cỡ mẫu lớn n ¡ 20 W xấp xỉ phân phối chuẩn với trung bình n (n + 1)(2n + 1) n (n + 1) µW = độ lệch chuẩn σW = , từ 24 W  µW tính giá trị kiểm định z = σW ? Bài toán 1: bác bỏ H0 z ¡ zα Bài toán 2: Bác bỏ H0 z   zα Bài toán 3: Bác bỏ H0 |z| ¡ zα/2 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 28 / 71 Kiểm định dấu hạng Wilcoxon cho hai trung vị, chọn mẫu theo Kiểm định cho trung vị tổng thể đơi Ví dụ Để so sánh tốc độ xử lý phần mềm có nhanh phần mềm dùng khơng, người ta chọn 10 liệu cho chúng xử lý, thời gian (giây) phần mềm lệnh ghi lại sau: TT Cũ Mới 9.98 9.88 9.88 9.86 9.84 9.75 9.99 9.80 9.94 9.87 9.84 9.84 9.86 9.87 10.12 9.86 9.90 9.83 10 9.91 9.86 Kết luận mức ý nghĩa 5% Lời giải: Gọi M1 , M2 trung vị thời gian xử lý phần mềm cũ phần mềm H0 : M1  M2 = H1 : M1  M2 ¡ Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 29 / 71 Kiểm định dấu hạng Wilcoxon cho hai trung vị, chọn mẫu theo Kiểm định cho trung vị tổng thể đơi Ví dụ Ta có bảng sau: Lệnh PM cũ PM 9.98 9.88 9.88 9.86 9.84 9.75 9.99 9.8 9.94 9.87 9.84 9.84 9.86 9.87 10.12 9.86 9.9 9.83 10 9.91 9.86 di +0.1 +0.02 +0.09 +0.19 +0.07 +0.0 -0.01 +0.26 +0.07 +0.05 | di | 0.1 0.02 0.09 0.19 0.07 0.0 0.01 0.26 0.07 0.05 Ri 4.5 Dấu + + + + + 4.5 44 + + + Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 30 / 71 Kiểm định dấu hạng Wilcoxon cho hai trung vị, chọn mẫu theo Kiểm định cho trung vị tổng thể đôi Ví dụ Giá trị kiểm định W = 44 n = 9, mức ý nghĩa α = 0.05, tra bảng ta có giá trị tới hạn 37 Vì W = 44 ¡ 37 nên ta bác bỏ H0 , tức ta có đủ chứng thống kê để khẳng định phần mềm xử lý nhanh phần mềm cũ Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 31 / 71 Kiểm định trung vị hai tổng thể R Kiểm định trung vị hai tổng thể R wilcox.test(x, y, alternative = , mu = , paired = ) Trong đó: x, y: Mẫu tổng thể thứ thứ hai paired = T/F: Hai mẫu theo đôi/Hai mẫu độc lập (mặc định F) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 32 / 71 Kiểm định trung vị hai tổng thể R Ví dụ Thực lại ví dụ sau, sử dụng phần mềm R: Để kiểm định tác động việc trưng bày đến doanh số, người ta chọn hai mẫu ngẫu nhiên, mẫu thứ gồm 10 gian hàng trưng bày bình thường, mẫu thứ hai gồm 10 gian hàng trưng bày đặc biệt, ghi chép doanh số gian hàng mẫu ta bảng sau Tại mức ý nghĩa 5% so sánh doanh số bán hai tuần Tuần trưng bày bình thường Tuần trưng bày đặc biệt 22 34 52 62 30 40 64 84 56 59 52 72 76 54 67 83 66 90 77 84 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 33 / 71 Kiểm định cho trung vị tổng thể Kiểm định trung vị hai tổng thể R Lời giải Lời giải: Gọi M1 , M2 trung vị doanh số bán hàng tuần trưng bày đặc biệt tuần trưng bày bình thường H0 : M1  M2 = H1 : M1  M2  p-giá trị = 0.01395   α = 0.05 nên ta bác bỏ H0 Ở mức ý nghĩa 5% ta kết luận có khác biệt doanh số bán tuần trưng bày bình thường tuần trưng bày đặc biệt Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 34 / 71 Kiểm định trung vị hai tổng thể R > TuanBinhThuong = c(22, 34, 52, 62, 30, 40, 64, 84, 56, 59) > TuanDacBiet = c(52, 71, 76, 54, 67, 83, 66, 90, 77, 84) > wilcox.test(TuanBinhThuong,TuanDacBiet) Wilcoxon rank sum test with continuity correction data: TuanBinhThuong and TuanDacBiet W = 17, p-value = 0.01395 alternative hypothesis: true location shift is not equal to Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 35 / 71 Kiểm định trung vị hai tổng thể R Ví dụ Thực lại ví dụ sau, sử dụng R: Để so sánh tốc độ xử lý phần mềm có nhanh phần mềm dùng khơng, người ta chọn 10 liệu cho chúng xử lý, thời gian (giây) phần mềm lệnh ghi lại sau: TT Cũ Mới 9.98 9.88 9.88 9.86 9.84 9.75 9.99 9.80 9.94 9.87 9.84 9.84 9.86 9.87 10.12 9.86 9.90 9.83 10 9.91 9.86 Kết luận mức ý nghĩa 5% Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 36 / 71 Kiểm định cho trung vị tổng thể Kiểm định trung vị hai tổng thể R Lời giải Gọi M1 , M2 trung vị thời gian xử lý phần mềm cũ phần mềm H0 : M1  M2 = H1 : M1  M2 ¡ p-giá trị = 0.006386 < 0.05 nên ta bác bỏ H0 Ở mức ý nghĩa 5% ta kết luận phần mềm xử lý nhanh phần mềm cũ Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Kiểm định cho trung vị tổng thể Tháng năm 2014 37 / 71 Kiểm định trung vị hai tổng thể R Kiểm định dấu hạng Wilcoxon R > PMCu = c(9.98, 9.88, 9.84, 9.99, 9.94, 9.84, 9.86, 10.12, 9.90, 9.91) > PMMoi = c(9.88, 9.86, 9.75, 9.80, 9.87, 9.84, 9.87, 9.86, 9.83, 9.86) > wilcox.test(PMCu,PMMoi,alt="g",paired = T) Wilcoxon signed rank test with continuity correction data: PMCu and PMMoi V = 44, p-value = 0.006386 alternative hypothesis: true location shift is greater than Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 38 / 71 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập Kiểm định Kruskal Wallis cho nhiều mẫu độc lập Khi muốn so sánh trung bình nhiều tổng thể, phân tích phương sai (ANOVA) sử dụng tổng thể có phân phối chuẩn phương sai Mục đích phép kiểm định phi tham số Kruskal Wallis so sánh trung bình nhiều tổng thể Tuy nhiên phép kiểm định khơng đòi hỏi giả thiết tổng thể chuẩn có phương sai Khi thỏa mãn giả thiết tổng thể chuẩn có phương sai phân tích phương sai cho kết tốt Khi không thỏa mãn giả thiết phép kiểm định phi tham số Kruskal Wallis cho kết tốt Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 39 / 71 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập Các bước thực Giả sử cần so sánh trung bình k tổng thể Giả sử có mẫu ngẫu nhiên độc lập gồm n1 , n2 , , nk quan sát từ k tổng thể Ta thực bước sau: Đặt cặp giả thuyết: Gọi µ1 , µ2 , , µk trung bình k tổng thể Cặp giả thuyết là: H0 : µ1 = µ2 =    = µk H1 : Tồn i  j cho µi  µj , i, j P t1, 2, 3u Gộp mẫu lại thành mẫu chung, tiến hành xếp hạng quan sát mẫu chung theo thứ tự tăng dần Nếu giá trị quan sát trùng hạng giống cách dùng số trung bình cộng hạng chúng Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 40 / 71 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập Các bước thực Tính giá trị kiểm định theo cơng thức: ¸ k W= 12 R2i n(n + 1) i=1 ni  3(n + 1) n = n1 + n2 +    + nk tổng số quan sát mẫu, Ri tổng hạng quan sát mẫu thứ i Quy luật định: Ta bác bỏ H0 mức ý nghĩa α W ¡ χ2k1,α Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 41 / 71 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập Ví dụ Người ta muốn kiểm tra xem thời gian làm thêm có ảnh hưởng đến kết học tập hay không Người ta chọn ngẫu nhiên ba nhóm sinh viên có thời gian làm thêm khác nhau: nhóm thứ gồm sinh viên có thời gian làm thêm (TGLT) ít, nhóm thứ hai có TGLT trung bình, nhóm thứ ba có TGLT nhiều Dữ liệu điểm tổng kết ba nhóm sinh viên tổng hợp xếp hạng bảng cho Hãy đưa kết luận vấn đề mức ý nghĩa 5% Cho biết giả thiết tổng thể chuẩn với phương sai không thỏa mãn Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 42 / 71 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập TGLT 6.3 7.0 6.5 6.6 7.3 6.9 6.4 Hạng 10.5 19 13.5 15.5 22 18 12 TGLT TB 7.2 6.6 6.1 5.8 6.8 7.1 5.9 R1 = 110.5 Hạng 21 15.5 4.5 17 20 TGLT nhiều 6.3 5.8 6.0 5.5 5.3 6.5 5.4 6.2 R2 = 92 Trần Minh Nguyệt (ĐH THĂNG LONG) Hạng 10.5 4.5 13.5 R3 = 50.5 Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 43 / 71 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập Lời giải Gọi µ1 , µ2 , µ3 điểm tổng kết trung bình sinh viên có TGLT ít, trung bình, nhiều H0 : µ1 = µ2 =    = µk H1 : Tồn i  j cho µi  µj , i, j P t1, 2, 3u Giá trị kiểm định: 12 R2i k W=  3(n + 1) n(n + 1)[ i=1 ni ] 12 110.52 922 50.52 = + +  3(22 + 1) = 8.602 22(22 + 1) 7 Giá trị tới hạn: χ22,0.05 = 5.99 Do χ22,0.05 = 5.99   W = 8.602 nên ta bác bỏ H0 Ở mức ý nghĩa 5%, ta kết luận thời gian làm thêm có ảnh hưởng đến kết học tập ° Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 44 / 71 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập Kiểm định Kruskal Wallis cho nhiều mẫu độc lập R Để thực kiểm định Kruskal Wallis R ta dùng lệnh: > kruskal.test( ) Trong đó: Nếu x véc tơ mẫu gộp phần tử mẫu cần so sánh, ta cần dùng thêm g véc tơ thứ bậc để phân loại phần tử x Câu lệnh trường hợp là: > kruskal.test(x, g) Nếu ta có véc tơ liệu riêng cho mẫu x1, x2, , xk ta thực lệnh: > kruskal.test(list(x1, x2, , xk)) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 45 / 71 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập Ví dụ Để tìm p-giá trị cho tốn ví dụ trên, ta thực sau: > MauGop= c(6.3, 7, 6.5, 6.6, 7.3, 6.9, 6.4, 7.2, 6.6, 6.1, 5.8, 6.8, 7.1, 5.9, 6.3, 5.8, 6.0, 5.5, 5.3, 6.5, 5.4, 6.2) > PhanNhom= factor(rep(c(1:3),c(7,7,8))) > kruskal.test(MauGop, PhanNhom) Kruskal-Wallis rank sum test data: MauGop and PhanNhom Kruskal-Wallis chi-squared= 8.6221, df = 2, p-value = 0.01342 Ta tìm p-giá trị = 0.01342 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 46 / 71 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập Ví dụ Hoặc thực sau: > > > > Nhom1= c(6.3,7,6.5,6.6,7.3,6.9,6.4) Nhom2= c(7.2,6.6,6.1,5.8,6.8,7.1,5.9) Nhom3= c(6.3,5.8,6.0,5.5,5.3,6.5,5.4,6.2) kruskal.test(list(Nhom1, Nhom2, Nhom3)) Kruskal-Wallis rank sum test data: list(Nhom1, Nhom2, Nhom3) Kruskal-Wallis chi-squared= 8.6221, df = 2, p-value = 0.01342 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 47 / 71 Kiểm định Chi - bình phương tính độc lập Ví dụ Trong đợt vận động xóa đói giảm nghèo địa phương, hộ nghèo vay vốn để phát triển kinh tế gia đình Sau thời gian có số hộ thành công số hộ thất bại Người ta cho có mối liên hệ độ tuổi chủ hộ với thành công việc phát triển kinh tế Để tìm hiểu vấn đề này, mẫu ngẫu nhiên gồm 1140 người vay tiền, có 570 người thành cơng 570 người thất bại xếp lớp chéo theo độ tuổi bảng sau: Kết Độ tuổi Thành công Thất bại Tổng hng Ô 25 92 172 264 26-35 166 211 377 36-45 114 97 211 ¥ 46 198 90 288 Tổng cột 570 570 1140 Với mức ý nghĩa 5% kiểm định xem có mối liên hệ ”kết cục” vay tiền với độ tuổi hay không? Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 48 / 71 Kiểm định Chi - bình phương tính độc lập Kiểm định Chi - bình phương tính độc lập Kiểm định Chi - bình phương tính độc lập dùng cần xác định xem hai biến định tính có mối quan hệ độc lập hay phụ thuộc với Cặp giả thuyết toán là: H0 : Hai biến định tính độc lập với (hay khơng có mối liên hệ hai biến) H1 : Hai biến định tính khơng độc lập (hay có mối liên hệ hai biến) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 49 / 71 Kiểm định Chi - bình phương tính độc lập Các bước thực Giả sử biến thứ có c biểu hiện, biến thứ hai có r biểu tạo thành bảng chữ nhật gồm c cột r hàng Ta thực kiểm định theo bước sau: (Oij  Eij )2 Tính giá trị kiểm định theo công thức: χ2 = ri=1 cj=1 Eij đó: Oij tần số quan sát thực tế dòng i, cột j Eij tần số lý thuyết dòng i, cột j, tính theo cơng thức: ° ° Eij = (Tổng dòng i)*(Tổng cột j) Cỡ mẫu ¡ χ2(r1)(c1),α Ở χ2(r1)(c1),α phân vị ứng với mức xác suất  α phân phối bình phương với df = (r  1)(c  1) bậc tự Quy luật định: Ta bác bỏ H0 χ2 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 50 / 71 Kiểm định Chi - bình phương tính độc lập Thực kiểm định ví dụ H0 : Khơng có mối liên hệ ”kết cục” vay tiền độ tuổi; H1 : Có mối liên hệ ”kết cục” vay tiền độ tuổi Bảng liệt kê tần số lý thuyết Eij tớnh c nh sau: tui Ô 25 26-35 36-45 ¥ 46 Kết Thành cơng 132 188.5 105.5 144 Thất bại 132 188.5 105.5 144 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 51 / 71 Kiểm định Chi - bình phương tính độc lập Giá trị kiểm định: χ2 = = ° ° (Oij  Eij )2 Eij (92  132)2 (172  132)2 (90  144)2 + +  + = 71.48 132 132 144 r i=1 c j=1 Giá trị tới hạn: χ23,0.05 = 7.81 Vì 71.48 ¡ 7.81 nên ta bác bỏ H0 Ở mức ý nghĩa 5% ta kết luận có mối liên hệ ”kết cục” vay tiền độ tuổi Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 52 / 71 Kiểm định Chi - bình phương tính độc lập Kiểm định tính độc lập R Để tìm p-giá trị cho tốn kiểm định tính độc lập R, ta dùng hàm: > chisq.test(x) x ma trận bảng giá trị quan sát hai thuộc tính cần kiểm định tính độc lập Trong ví dụ trên, ta thực sau: > Mau=c(92,172,166,211,114,97,198,90) > x=matrix(Mau,nrow=4,byrow=T) > chisq.test(x) Pearson's Chi-squared test data: x X-squared = 71.4834, df = 3, p-value = 2.054e-15 Ta tìm p-giá trị = 2.054  1015 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 53 / 71 Kiểm định chi - bình phương phù hợp Ví dụ Một công ty chuẩn bị bốn cách thức bảo hiểm A, B, C, D khác cho công nhân Một mẫu ngẫu nhiên gồm 200 chọn hỏi ý kiến việc ưa thích cách thức Kết cho bảng sau: Cách thức Số công nhân chọn A 10 B 98 C 64 D 28 Hãy kiểm định giả thuyết không tỷ lệ phần trăm cơng nhân ưa thích bốn phương thức bảo hiểm 20%, 40%, 25%, 15% Dùng mức ý nghĩa 5% Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 54 / 71 Kiểm định chi - bình phương phù hợp Kiểm định chi - bình phương phù hợp Kiểm định chi - bình phương phù hợp sử dụng ta cần kiểm tra xem phân phối tổng thể có tuân theo quy luật phân phối xác suất hay khơng Quy luật phân phối xác suất thường cho hai dạng sau: Có phân lớp tổng thể cho biết tỷ lệ lớp tổng thể Một quy luật phân phối xác suất biết (ví dụ phân phối nhị thức, phân phối Poisson, ) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 55 / 71 Kiểm định chi - bình phương phù hợp Ví dụ Một cách để xác định xem tác giả đoạn văn so sánh tần số xuất từ ngữ Nghiên cứu số lần xuất từ ngữ ”có thể” đoạn văn dài xấp xỉ 200 từ người ta ghi lại sau: Số lần xuất Số đoạn văn 156 63 ¥3 29 Tổng 262 14 Với mức ý nghĩa 1% kiểm định xem số lần xuất từ ngữ ”có thể” đoạn văn dài xấp xỉ 200 từ có tuân theo phân phối Poisson không? Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 56 / 71 Kiểm định chi - bình phương phù hợp Kiểm định chi - bình phương phù hợp Chọn mẫu ngẫu nhiên gồm n phần tử từ tổng thể mà giá trị chúng xếp vào k lớp Gọi Oi tần số mẫu lớp thứ i, @i = 1, 2, , k: Lớp Tần số O1 O2 O3 k Ok Tổng n Quy luật phân phối xác suất: Xác suất để phần tử rơi vào lớp i pi , @i = 1, 2, , k Lớp Xác suất p1 p2 p3 k pk Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 57 / 71 Kiểm định chi - bình phương phù hợp Các bước thực Đặt cặp giả thuyết H0 : Tổng thể tuân theo quy luật xác suất nêu (tức xác suất để phần tử rơi vào lớp i pi , i = 1, 2, , k) H1 : Tổng thể không tuân theo quy luật xác suất nêu Tính số phần tử kỳ vọng rơi vào lớp Ei theo công thức: Ei = npi , i = 1, 2, , n Tính giá trị kiểm định theo cơng thức: ¸ (O  E ) k χ2 = i i Ei i=1 Quy luật định: Ta bác bỏ H0 χ2 ¡ χ2k1,α Trong χ2k1,α xác định phân phối Chi - bình phương với (k  1) bậc tự do: P(χ2k1 ¡ χ2k1,α ) = α Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 58 / 71 Kiểm định chi - bình phương phù hợp Ví dụ Một cơng ty chuẩn bị bốn cách thức bảo hiểm A, B, C, D khác cho công nhân Một mẫu ngẫu nhiên gồm 200 chọn hỏi ý kiến việc ưa thích cách thức Kết cho bảng sau: Cách thức Số công nhân chọn A 10 B 98 C 64 D 28 Hãy kiểm định giả thuyết không tỷ lệ phần trăm công nhân ưa thích bốn phương thức bảo hiểm 20%, 40%, 25%, 15% mức ý nghĩa 5% Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 59 / 71 Kiểm định chi - bình phương phù hợp Ví dụ Gọi p1 , p2 , p3 , p4 tỷ lệ công nhân ưa thích bốn phương thức bào hiểm A, B, C, D H0 : p1 = 0.2, p2 = 0.4, p3 = 0.25, p4 = 0.15 H1 : Tổng thể không tuân theo quy luật phân phối xác suất Ta có bảng sau: Cách thức A Oi 10 pi 0.2 Ei 40 B 98 0.4 80 C 64 0.25 50 D 28 0.15 30 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 60 / 71 Kiểm định chi - bình phương phù hợp Ví dụ Giá trị kiểm định: χ2 = = ° (Oi  Ei )2 Ei (10  40)2 (28  30)2 +  + = 30.6033 40 30 k i=1 Giá trị tới hạn χ241,α = χ23,0.05 = 7.81 Vì 30.6033 ¡ 7.81 nên ta bác bỏ H0 Ở mức ý nghĩa 5% ta kết luận tỷ lệ phần trăm cơng nhân ưa thích bốn phương thức bảo hiểm A, B, C, D không tuân theo tỷ lệ nêu Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 61 / 71 Kiểm định chi - bình phương phù hợp Ví dụ Một cách để định xem tác giả đoạn văn so sánh tần số xuất từ ngữ Nghiên cứu số lần xuất từ ngữ ”có thể” đoạn văn dài xấp xỉ 200 từ người ta ghi lại sau: Số lần xuất Số đoạn văn 156 63 ¥3 29 Tổng 262 14 Với mức ý nghĩa 1% kiểm định xem số lần xuất từ ngữ ”có thể” có tn theo phân phối Poisson khơng? Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 62 / 71 Kiểm định chi - bình phương phù hợp Lời giải Gọi X biến ngẫu nhiên số lần xuất từ ”có thể” đoạn văn dài xấp xỉ 200 từ H0 : X tuân theo phân phối Poisson H1 : X không tuân theo phân phối Poisson Theo bảng liệu ta có trung bình mẫu x = 0.62 Ta lấy x = 0.62 để ước lượng tham số λ phân phối Poisson Xác định pi Ei : Nếu X tuân theo phân phối Poisson với λ = 0.62 ta có xác suất pi xác định sau: p1 = P(X = 0) = 0.5379 p2 = P(X = 1) = 0.3335 p3 = P(X = 2) = 0.1034 p4 = P(X ¥ 3) =  p1  p2  p3 = 0.0252 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 63 / 71 Kiểm định chi - bình phương phù hợp Từ ta có bảng sau: Số lần xuất Oi pi Ei 156 0.5379 140.9298 63 0.3335 87.3770 ¥3 29 0.1034 27.0908 Tổng 262 262 14 0.0252 6.6024 Giá trị kiểm định: ¸ (O  E ) = k χ i=1 i i Ei = 16.8355 Có k = có tham số λ cần ước lượng nên số bậc tự χ2 k   = Vì vậy, giá trị tới hạn là: χ22,0.01 = 9.21 16.83355 ¡ 9.21 nên ta bác bỏ H0 Ở mức ý nghĩa 1% ta kết luận số lần xuất từ ngữ ”có thể” khơng tn theo phân phối Poisson Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 64 / 71 Kiểm định chi - bình phương phù hợp Chú ý Trong kiểm định ta cần ước lượng cho m tham số từ tổng thể mẫu số bậc tự phân phối Chi - bình phương (k-1-m) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 65 / 71 Kiểm định chi - bình phương phù hợp Kiểm định Chi - bình phương phân phối chuẩn Ta tiến hành kiểm định tổng thể có tn theo phân phối chuẩn với trung bình µ độ lệch chuẩn σ hay không? Trước hết ta cần phân tổ tập liệu mẫu Chẳng hạn chia thành tổ: Tổ 1:   µ  2σ Tổ 2: µ  2σ đến µ  σ  Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 66 / 71 Kiểm định chi - bình phương phù hợp Kiểm định Chi - bình phương phân phối chuẩn Ta tiến hành kiểm định với cặp giả thuyết: H0 : Tổng thể tuân theo phân phối chuẩn với trung bình µ độ lệch chuẩn σ H1 : Tổng thể khơng tn theo phân phối chuẩn với trung bình µ độ lệch chuẩn σ Xác định số tổ cần chia, tính tần số tổ Tính xác suất pi tỷ lệ phần tử thuộc tổ thứ i tần số lý thuyết Ei = npi theo H0 Việc phân tổ phải đảm bảo cho Ei Trong trường hợp ngược lại ta cần tăng khoảng cách tổ để đảm bảo điều thỏa mãn Tính giá trị kiểm định ¸ (O  E ) = k χ i=1 i i Ei Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 67 / 71 Kiểm định chi - bình phương phù hợp Kiểm định Chi - bình phương phân phối chuẩn Xác định giá trị tới hạn χ2k1,α giá trị thỏa mãn P(χ2k1 ¡ χ2k1,α ) = α χ2k1 biến ngẫu nhiên có phân phối Chi - bình phương với k  bậc tự Quy luật định: Bác bỏ H0 χ2 ¡ χ2k1,α Chú ý: Trong kiểm định tổng thể tuân theo phân phối chuẩn, ta cần ước lượng µ σ x s số bậc tự phân phối Chi - bình phương k   Tức là, quy luật định ta bác bỏ H0 χ2 ¡ χ2k3,α Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 68 / 71 Kiểm định chi - bình phương phù hợp Kiểm định mức độ phù hợp R Để tìm p-giá trị cho tốn kiểm định mức độ phù hợp R ta dùng lệnh: > chisq.test(x, p = ) Trong đó: x: véc tơ liệu, p: véc tơ chứa pi Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 69 / 71 Kiểm định chi - bình phương phù hợp Trong ví dụ ta thực sau: > chisq.test(c(10,98,64,28), p=c(0.2,0.4,0.25,0.15)) Chi-squared test for given probabilities data: c(10, 98, 64, 28) X-squared = 30.6033, df = 3, p-value = 1.030e-06 Ta tìm p-giá trị = 1.03  106 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 70 / 71 Kiểm định chi - bình phương phù hợp Trong ví dụ ta thực sau: > p0= c(dpois(c(0,1,2), 0.62), 1-sum(dpois(c(0,1,2), 0.62))) > chisq.test(c(156, 63, 29, 14), p= p0) Chi-squared test for given probabilities data: c(156, 63, 29, 14) X-squared = 16.8355, df = 3, p-value = 0.000764 Ta tìm p-giá trị=0.000764 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 71 / 71 ... Kruskal-Wallis rank sum test data: list(Nhom1, Nhom2, Nhom3) Kruskal-Wallis chi-squared= 8.6221, df = 2, p-value = 0.01342 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã... suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 54 / 71 Kiểm định chi - bình phương phù hợp Kiểm định chi - bình phương phù hợp Kiểm định chi - bình phương phù hợp sử dụng ta cần kiểm... - bình phương (k-1-m) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 65 / 71 Kiểm định chi - bình phương phù hợp Kiểm định Chi - bình phương phân

Ngày đăng: 09/12/2017, 06:06