1. Trang chủ
  2. » Thể loại khác

TRƯỜNG ĐẠI HỌC TÀI CHÍNH – MARKETING KHOA CƠ BẢN CHƯƠNG KIỂM ĐỊNH PHI THAM SỐ

20 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 20
Dung lượng 0,92 MB

Nội dung

TRƯỜNG ĐẠI HỌC TÀI CHÍNH – MARKETING KHOA CƠ BẢN CHƯƠNG KIỂM ĐỊNH PHI THAM SỐ MỤC TIÊU Kết thúc chương 9, người học có khả năng: • Nhận biết cách sử dụng kiểm định dấu tổng hạng Wilcoxon cho trung vị tổng thể • Biết cách diễn đạt thực kiểm định Mann-Whitney • Phân tích phương sai ANOVA kiểm định phi tham số Kruskal-Wallis • Thực kiểm định c Kiểm định tham số thực điều kiện tổng thể có phân phối chuẩn Khi tổng thể khơng thỏa mãn điều khơng thể sử dụng cơng cụ Trong chương này, xem xét cơng cụ giúp kiểm định giả thuyết tổng thể có phân phối bất kỳ, khơng theo phân phối chuẩn Kiểm định phi tham số (Nonparametric Tests) phù hợp liệu phân tích loại liệu định tính (thang đo định danh thứ bậc) hay liệu định lượng khơng có phân phối chuẩn Bảng sau liệt kê số kiểm định phi tham số kiểm định tham số tương ứng Phi tham số Tham số Kiểm định giả thuyết trị trung bình tổng thể Kiểm định dấu hạng Kiểm định trị Wilcoxon trung bình trường hợp mẫu phối hợp cặp Kiểm định tổng hạng Kiểm định trị Wilconxon trung bình trường hợp mẫu độc lập Kiểm định Kruskal-Wallis Phân tích ANOVA Ngồi cịn tìm hiểu thêm kiểm định Chi-Bình Phương để kiểm định giả thuyết phân phối tổng thể kiểm định giả thuyết mối liên hệ (hay tính độc lập) 9.1 KIỂM ĐỊNH DẤU Trong phần này, mô tả kiểm định phi tham số cho trường hợp mẫu mẫu cặp Gọi M trung vị tổng thể Khi đó: P (X £ M ) = 0.5 = P (X > M ) Đặt giả thuyết H : M = m0 H a : M > m0 Giả sử phân phối tổng thể liên tục để P (X £ M ) = 0.5 Gọi X i quan sát thứ i gọi N + số quan sát có giá trị lớn m0 Chúng ta bác bỏ H n+ số quan sát N + lớn Kiểm định gọi kiểm định dấu Tại mức ý nghĩa a , bác bỏ H n+ ³ k , với k chọn sau: P (N + ³ k | M = m0) = a Trái lại, đối thuyết H a : M ¹ m0 , giá trị tới hạn có dạng N + £ k N + ³ k1 , P (N + £ k) + P (N + ³ k1) = a Để xác định giá trị k k1, cần xác định phân phối N + Kiểm định thực theo nguyên tắc mẫu lấy từ tổng thể có phân phối liên tục, giá trị quan sát giá trị trung vị (Median) có xác suất Vì số giá trị quan sát mẫu median tuân theo phân phối nhị thức với tham số n xác suất p = n kích thước mẫu Các bước tiến hành kiểm định: Đặt giả thuyết: H : M = m0 H a : M > m0 Thay giá trị quan sát lớn m0 dấu cộng (+) nhỏ m0 dấu trừ (-) Nếu giá trị quan sát mẫu m0 , loại bỏ quan sát điều chỉnh lại kích thước mẫu n Đặt n+ số dấu ( + ) mẫu Với n p = , từ bảng phân phối nhị thức, tìm g = P (N + ³ n+) Quyết định: g < a H bị bác bỏ Dựa vào thông tin mẫu đến kết luận trung vị tổng thể lớn m0 mức ý nghĩa a Trái lại khơng bác bỏ H Giả sử tổng thể có phân phối liên tục Chú ý: Nếu muốn dùng phương pháp p _ value : Giá trị p _ value tính theo cơng thức: pvalue n ỉư 1÷ ÷ = P (N n ) = C ỗ =g ỗ ữ ỗ ữ ố ứ i =k + + n i n Ví dụ: Cho dãy số liệu: 1.51 1.35 1.69 1.48 1.29 1.27 1.54 1.39 1.45 Hãy kiểm định giả thuyết sau: H : M = 1.4 H a : M > 1.4 Giải: Chúng ta kiểm định: H : M = 1.4 H a : M > 1.4 Thay giá trị lớn 1.4 dấu (+) nhỏ dấu (- ) , ta có: +- +- - +- + Vậy, n+ = Tra bảng phân phối nhị thức với n = p = Ta được: P (N + ³ 5) = 0.5 Nên pvalue = 0.5 Vì a = 0.05 < 0.5 Giả thiết H bị bác bỏ Ta kết luận trung vị không vượt 1.4 Khi cở mẫu n lớn, áp dụng xấp xỉ phân phối nhị thức phân phối chuẩn Nghĩa , thống kê N + xấp xỉ phân phối chuẩn n n , phương sai np(1- p) = Ta có: n N+ 2N + - n Z= = : N (0,1) n n Chúng ta sử dụng thống kê n lớn, nghĩa np ³ có trung bình np = n(1- p) ³ (vì p = nên n ³ 10 ta áp dụng) Sau tóm tắt kiểm định dấu n ³ 10 lớn: H : M = m0 Giả thuyết: Thống kê: Đối thuyết Miền bác bỏ H a : M > m0 Z ³ Za H a : M < m0 Z £ - Za H a : M ¹ m0 | Z |³ Za Z= 2N + - n n Quyết định: Bác bỏ H , giá trị Z rơi vào miền bác bỏ ta kết luận H a với độ tin cậy (1- a)100% Trái lại, không bác bỏ H Giả thiết: i) Tổng thể có phân phối liên tục ii) Kích thước mẫu lớn 10 (sau loại bỏ quan sát có dấu 0) iii) Số quan sát bị loại bỏ không vượt 10% cỡ mẫu Ví dụ: Để đo lường hiệu qui trình cho việc cắt tỉa vườn nho, 15 công nhân đươc giao nhiệm vụ cắt tỉa Kết đo sau (giờ / đơn vị diện tích): 5.2 5.0 4.8 3.9 6.1 4.2 4.4 5.5 5.8 4.5 4.2 5.3 4.9 4.7 4.9 Hãy kiểm định giả thuyết trung vị thời gian để cắt tỉa phương pháp 4.5 Đối thuyết lớn Với mức ý nghĩ 5% Giải: Đặt giả thuyết: H : M = 4.5 H a : M > 4.5 Thay quan sát lớn 4.5 dâu (+) nhỏ dấu (- ) Ta có: + + +- +- - + +- + + + + Vì có quan sát có giá trị 4.5, ta loại bỏ, lấy n = 14 Vậy N + = 10 Ta tính: Z= 2N + - n n = 20- 14 = 1.6 14 Vì a = 0.05, tra bảng Gauss Z0.05 = 1.645 Vì miền bác bỏ Z > 1.645 Ta chấp nhận H dến kết luận giá trị trung vị thời gian để cắt tỉa vườn nho 4.5 9.2 KIỂM ĐỊNH DẤU VÀ HẠNG WILCOXON Trong kiểm định dấu, ta xem xét quan sát lớn nhỏ m0 bỏ qua độ lớn chênh lệch Kiểm định dấu hạng Wilconxon sử dụng thông tin dấu lẫn độ lớn chênh lệch | xi - m0 | Quan sát nhỏ xếp thứ hạng lớn … Tuy nhiên, kiểm định dấu hạng Wilcoxon yêu cầu thêm giả thiết phân phối tổng thể liên tục đối xứng, số liệu dạng thứ bậc, Kiểm định Wilcoxon sử dụng Quy trình kiểm định dấu hạng Wilcoxon cỡ mẫu nhỏ: Đặt giả thuyết: H : M = m0 H a : M ¹ m0 Tính Zi =| xi - m0 | cho quan sát Thay giá trị quan sát lớn m0 dấu (+) nhỏ dấu (- ) Nếu giá trị quan sát m0 , bỏ quan sát điều chỉnh cỡ mẫu n phù hợp Xếp hạng Zi với thứ hạng Nếu hai giá trị Zi nhau, xếp hạng Zi giá trị trung bình cho tất thứ hạng Đặt W + tổng thứ hạng ứng với dấu (+) W - tổng thứ hạng ứng với dấu (- ) Quyết định: Bác bỏ H nếu: W + £ c1 với P (W + £ c1) = W + ³ c2 với Hoặc a P (W + ³ c2) = a Giả thiết: Tổng thể có phân phối liên tục đối xứng Số quan sát bị loại bỏ 10% cỡ mẫu Phân phối xác W + gần phức tạp nhận thấy Tuy nhiên, với giá trị n đó, phân phối cho bảng kiểm định dấu hạng Wilcoxon Trong kiểm định dấu hạng Wilcoxon, miền bác bỏ dựa đối thuyết H a : - H a : M > m0 , miền bác bỏ W + ³ c , P (W + ³ c) = a - H a : M < m0 , miền bác bỏ W + £ c , P (W + £ c) = a Ví dụ: Có dãy số liệu sau: 1.511.35 1.69 1.48 1.29 1.27 1.54 1.39 1.45 Hãy kiểm định giả thuyết H : M = 1.4 đối thuyết H a : M ¹ 1.4 Sử dụng mức ý nghĩa 0.05 Giải: Đặt giả thuyết: H : M = 1.4 H a : M ¹ 1.4 Ta có W + = 29 n = Từ bảng kiểm định dấu hạng Wilcoxon, ta bỏ H W + £ W + ³ 38 ứng với mức ý nghĩa a = 0.054 Vì W + = 29 không nằm miền bác bỏ, ta không loại bỏ giả thuyết H kết luận M = 1.4 xi Zi =| xi - 1.4| Dấ u Hạng (R) 1.5 1.3 1.6 1.4 1.2 1.2 1.5 1.3 1.4 0.11 0.05 0.29 0.08 0.11 0.13 0.14 0.01 0.01 + + + + + 5.5 5.5 1.5 1.5 Khi cỡ mẫu n đủ lớn, với giả thuyết H đúng, phân phối W + xấp xỉ chuẩn có trung bình phương sai là: E (W + ) = n(n + 1) Var (W + ) = n(n + 1)(2n + 1) 24 Do đó, giá trị thống kê n(n + 1) Z= n(n + 1)(2n + 1) / 24 W+- Xấp xỉ thường sử dụng n > 20 Tóm tắt kiểm định dấu hạng Wilcoxon ( n > 20) Chúng ta kiểm định giả thuyết: H : M = m0 ìï M > m ïï ï H a : í M < m0 ïï ïï M m0 ợ W + - n(n + 1) Z= n(n + 1)(2n + 1) / 24 Đối thuyết Giá trị thống kê: ìï Z > Z ïï a ïí Z < Z a ïï ïï | Z |> Za / ỵ Miền bác bỏ: Quyết định: bác hỏ H giá trị thống kê rơi vào miền bác bỏ kết luận H a với độ tin cậy (1- a)100% Giả thiết: i) Phân phối tổng thể liên tục đối xứng ii) Cỡ mẫu lớn 20 iii) Số quan sat loại bỏ không vượt 10% cỡ mẫu Ví dụ: Có số liệu tiền th phịng ($) 25 hộ gia đình thành phố sau: 425 960 1450655 1025750 670 975 660 880 1250780 870 930 550 575 425 900 525 1800 545 840 765 950 1080 Hãy kiểm định giả thuyết trung vị tiền thuê nhà thành phố $750, đối thuyết cao mức ý nghĩa 5% Giải: Ta có kiểm định: H : M = 750 H a : M > 750 xi Zi =| xi - 750| 425 960 142 655 325 210 700 95 302 Dấ u + + + Hạn g 19.5 25 23 18 102 750 670 975 660 880 125 780 870 930 550 575 425 900 525 180 545 840 765 950 108 0 80 225 90 130 500 30 120 180 200 175 325 150 225 1050 205 90 15 200 330 * + + + + + + + + + + + + 16.5 4.5 22 11 12.5 10 19.5 16.5 24 14 4.5 12.5 21 Ở đây, n = 24, W + = 172.5 giá trị thống kê: 1 n(n + 1) 172.5- 24.25 4 Z= = = 0.64286 n(n + 1)(2n + 1) / 24 24.25.49 24 Với a = 0.05, miền bác bỏ Z < 1.645.Chấp nhận H Trung vị tiền W+- thuê nhà thành phố không lớn $750 Kiểm định dấu hạng Wilcoxon cho mẫu phối hợp cặp (2 mẫu phụ thuộc) Kiểm định dấu hạng Wilcoxon sử dụng muốn kiểm định mẫu phối hợp cặp mà chất so sánh hai trung vị Các bước thực sau: Quy trình kiểm định dấu hạng Wilcoxon cỡ mẫu nhỏ: Đặt giả thuyết: H0 : M = H a : M > 0(M < 0, M ¹ 0) Tính Zi =| xi - m0 | cho quan sát Xếp hạng Zi với thứ hạng Nếu hai giá trị Zi nhau, xếp hạng Zi giá trị trung bình cho tất thứ hạng Đặt W + tổng thứ hạng ứng với dấu (+) W - tổng thứ hạng ứng với dấu (- ) Quy tắc chấp nhận hay bác bỏ H : - Trường hợp: n nhỏ với mức ý nghĩa a xác định: • Đối với kiếm định hai phía, W + ³ c1 W + £ c2 bác bỏ H • Với kiểm định bên phải W + ³ c1 bác bỏ H • Với kiểm định bên trái W + £ c1 bác bỏ H - Trường hợp n > 20 Phân phối W + xấp xỉ chuẩn có trung bình phương sai là: E (W + ) = n(n + 1) Var (W + ) = n(n + 1)(2n + 1) 24 Do đó, giá trị thống kê n(n + 1) Z= n(n + 1)(2n + 1) / 24 W+- Ví dụ: Chương trình ăn kiên công ty cho thực ăn kiên sau tháng giảm cân Để kiểm tra phát biểu này, mẫu ngẫu nhiên thực người, có bảng số liệu sau: Trước: 180 199 175 226 189 205 169 211 10 Sau: 172 191 172 230 178 199 171 201 Sử dụng mức ý nghĩa 5%, kết luận chương trình thực làm giảm trung vị khối lượng tổng thể không? Giải: Đặt M khác trung vị tổng thể trước sau thực chương trình: Đặt giả thuyết: H : M = H a : M < Thay giá trị khác lớn dấu (+) nhỏ dấu (- ) Ta có: Sự khác -8 -8 -3 -11 -6 -10 biệt Dấu + + Vì n = 8, N + = , ta có giá trị thống kê: Z= 2N + - n n = 4- 8 = - 1.414 Với a = 0.05, Za = 1.645 miền bác bỏ Z < - 1.645 Ta cháp nhận H 9.3 KIỂM ĐỊNH MANN-WHITNEY(Kiểm định U) Ở phần trên, nghiên cứu kiểm định Wilcoxon áp dụng cho mẫu cặp, mục đích kiểm định tương tự tiến hành liệu định tính khơng thỏa mãn yêu cầu phân phối chuẩn, với mẫu độc lập, áp dụng phương pháp kiểm định Mann-Whitney U Kiểm định U dùng thỏa mãn điều kiện sau: - Hai mẫu ngẫu nhiên độc lập - Dữ liệu mẫu đo lường thấp thang đo thứ bậc - Nếu có khác biệt hai phân phối hai tổng thể khác khuynh hướng trung tâm 9.3.1 Trường hợp mẫu nhỏ (n £ 20) H : M £ M H a : M > M • Phát biểu giả thuyết • Xác định mức ý nghĩa tốn • Kết hợp liệu hai nhóm thành tập liệu Sắp xếp hạng tập liệu theo quy tắc giá trị nhỏ hạng 11 tăng dần, quan sát đồng giá trị ta lấy giá trị trung bình • Tính tốn giá trị kiểm định U theo công thức: U = n1n2 + n1(n1 + 1) å R1 U = n1n2 + n2(n2 + 1) å R2 n1, n2 cỡ mẫu mẫu mẫu hai, • Chọn giá trị kiểm định U Nguyên tắc chọn giá trị nhỏ giá trị U Khi định, quy tắc chung giá trị kiểm định U giá trị kiểm định U nhỏ giá trị tới hạn bảng tra Mann-Whitney U bác bỏ giả thuyết H 9.3.2 Trường hợp mẫu lớn (n > 20) Khi tăng kích thước mẫu lên, phân phối U tiệm cận phân phối chuẩn với trung bình phương sau: E (U ) = var(U ) = n1n2 n1n2(n1 + n2 + 1) 12 Đại lượng kiểm định tính sau: Z = U - E (U ) var(U ) Tiêu chuẩn định: Trường hợp kiểm định bên: H a : M ¹ M - Chấp nhận H - Za/ £ Z £ Za/ - Bác bỏ H Z < - Za/ hay Z > Za/ Trường hợp kiểm định bên: M < M , bác bỏ H Z < - Za/ Trường hợp kiểm định bên: M > M , bác bỏ H Z > - Za/ Nếu chưa định sử dụng mức ý nghĩa nào, tính giá trị p để kết luận 9.4 KIỂM ĐỊNH KRUSKAL-WALLIS 12 Kiểm định Kruskal-Wallis trường hợp tổng quát kiểm định tổng hạng Wilxonxon cho hai mẫu độc lập.Trong phân tích phương sai, thấy kiểm định kiểm định F áp dụng nhóm so sánh có phân phối chuẩn phương sai Trong trường hợp không thỏa điều kiện này, chuyển đổi liệu yếu tố kết từ dạng định lượng dạng định tính (thứ bậc) áp dụng kiểm định phi tham số Kruskal-Wallis Giả sử có k tổng thể có phân phối bất kỳ, với qi trung vị tổng thể thứ i k mẫu ngẫu nhiên chọn từ k tổng thể.Gọi ni kích thước mẫu tổng thể thứ i Chúng ta muốn kiểm định trung vị nhóm mẫu : H : q1 = q2 = L = qk = H a : q1 ¹ q2 ¹ L ¹ qk ¹ Đặt q1 = q2 = L = qk = t Khi đó, số quan sát yij - t, (i = 1,2, , k) từ tổng thể có trung vị Bởi trình kiểm định KruskalWallis phụ thuộc vào hạng yij (yij - t) Ta có bảng tóm tắt quy trình kiểm định Kruskal-Wallis: k Đặt N = å ni quan sát yij xếp theo thứ tự Gọi i =1 rij = R(yij ) ni Tính tổng nhóm: ri = å rij , (i = 1, k) trung bình i =1 nhóm: ri = ri , (- = 1, k) ni k Gọi r = å ri = i =1 N (N + 1) r N +1 r = = N 13 Tính giá trị thống kê Kruskal-Wallis: H = k 12 ni (ri - r )2 å N (N + 1) i =1 k ri 12 H = - 3(N + 1) ] å N (N + 1) i =1 ni Bác bỏ H nếu: H ³ c số c chọn từ giá trị cụ thể a Phân phối H phức tạp, phụ thuộc vào kích thước mẫu n1, n2, L , nk khơng có bảng tính giá trị cụ thể cho trường mẫu nhỏ Khi k hoăc N lớn, phân phối H giả thuyết H xấp xỉ phân phối chi bình phương với (k - 1) bậc tự Kết có từ định lý KrusKal-Wallis (khơng chứng minh): Định lý: Khi H : q1 = q2 = L = qk đúng, N lớn thống k H = k 12 ni (ri - r )2 å N (N + 1) i =1 có phân phối tiệm cận với phân phối chi bình phương (k - 1) bậc tự Do đó, với mức ý nghĩa a bác bỏ H : H > c a2(k - 1) Xấp xỉ chi bình phương chấp nhận cỡ nhóm mẫu ni > với k ³ Tuy nhiên, ta sử dụng chi bình phương cho với giá trị ni Trong kiểm định miền bác bỏ, dùng bảng chi bình phương Ví dụ: Một nổ lực điều tra phí bảo hiểm ơtơ cơng ty bảo hiểm, khảo sát ngẫu nhiên cách chọn vài tài xế mua bảo hiểm công ty bảo hiểm khác Giả sử 14 người có xe ơtơ giống nhau, kinh nghiệm lái xe mức độ bảo dưỡng Bảng bên cho mức phí bảo hiểm trả tháng: Công Công Công ty ty ty 378 396 348 330 438 360 294 336 522 474 318 432 Sử dụng mức ý nghĩa 5% , kiểm định trung vị mức phí bảo hiểm cơng ty Giải: Ta có giả thuyết: Đối thuyết: H0 : M1 = M2 = M = Ha : M ¹ M ¹ M ¹ M i trung vị mức phí bảo hiểm cơng ty thứ i (i = 1,k) Với n1 = 4, n2 = 3, n3 = Do đó, N = å ni = 12 quan sát Gọi Y i =1 quan sát xếp theo thứ tự tăng dần: Phí bảo 294 318 330 336 hiểm 438 474 522 Nhóm 3 1 Hạng 10 11 12 348 360 378 396 432 2 3 Do đó, tổng hạng nhóm: r1 = 24, r2 = 23, r3 = 31 r1 + r2 + r3 = 78 = N (N + 1) 12.13 = 2 Giá trị thống kê: 15 k ri2 12 H = å - 3(N + 1) N (N + 1) i =1 ni 12 ỉ 242 232 312 ữ ỗ ữ = + + ỗ ữ- 3.13 = 0.42564 ỗ4 12.13 ỗ 5ữ ố ứ Tra bng: c 0.05 (2) = 5.991 Miền bác bỏ H ³ 5.991 Vậy ta chấp nhận H trung vị phí bảo hiểm ơtơ cơng ty 9.5 KIỂM ĐỊNH CHI BÌNH PHƯƠNG c 9.5.1 Kiểm định độc lập Trong thực tế nhiều gặp phải số tình địi hỏi phải tìm hiểu mối liên hệ biến định tính, chẳng hạn mối liên hệ kết học tập việc có hay khơng có người u, mối liên hệ độ bền hôn nhân với thời gian yêu trước kết hôn…Kiểm định chi bình phương giúp tiến hành việc tìm hiểu mối liên hệ có thật tồn hay không Kiểm định độc lập hay quan hệ hai biến định tính tình hay gặp, giả thuyết chung cho loại kiểm định là: H : Hai biến định tính độc lập H a : Hai biến định tính khơng độc lập Bài tốn tổng qt: Giả sử có mẫu ngẫu nhiên gồm n quan sát phân nhóm kết hợp thành tiêu thức với nhau, hình thành nên bảng phân nhóm kết hợp gồn r hàng c cột Gọi Oij số lượng quan sát tương ứng với hàng i cột j , Ri tổng số quan sát dòng thứ i C j tổng số quan sát cột thứ j , n tổng quan sát r dòng, đồng thời số quan sát c cột Phân nhóm Phân nhóm theo tiêu thức thứ … c Σ theo tiêu thức thứ hai O11 O12 … O1c R1 O21 O22 O2c R2 … … … … … … r Or1 Or2 … Orc Rr Σ C1 C2 … Cc n 16  Bước 1: Đặt giả thuyết: H : Khơng có mối liên hệ hai tiêu thức H a : Có tồn mối liên hệ hai tiêu thức  Bước 2: Tính số lượng quan sát theo giả thuyết H E ij = C j ´ Ri n r  Bước 3: Giá trị kiểm định: c = å c å i =1 j =1 (O ij - E ij ) E ij  Bước 4: Quy tắc kiểm định: Ở mức ý nghĩa α, bác bỏ giả thuyết H khi: c > c(2r - 1)(c- 1),a Ví dụ: Một nhà nghiên cứu thực nhằm xem xét mối liên hệ giới tính ưa thích nhãn hiệu nước giải khát, mẫu ngẫu nhiên 2.425 người tiêu dùng với nhãn hiệu nước giải khát ưa thích sau: Nhãn hiệu ưa thích Giới tính Coca Pepsi 7Up Nam 308 177 114 Nữ 502 627 697 Kiểm định giả thuyết khơng có mối liên hệ giới tính ưa thích nhãn hiệu nước giải khát mức ý nghĩa 0,5% (1) Giả thuyết H0: Khơng có mối liên hệ giới tính ưa thích nhãn hiệu nước giải khát (2) Giá trị kiểm định: Giới tính Nhãn hiệu ưa thích Coca Pepsi 7Up Ri χ2 Nam 308 177 114 599 E1j 200, 198,6 200,3 599 08 (O1j – E1j) /E1j 58,2 2,35 37,20 97,7 Nữ 502 627 697 182 17 E2j (O2j – E2j)2/E2j r χ =å i=1 609, 92 19,1 810 605,4 610,6 0,77 12,20 c (Oij - E ij )2 j=1 E ij å 804 811 182 32,0 242 = 97,76 + 32, 07 = 129, 83 (3) So sánh có χ2 = 129,83 > χ (2-1)(3- 1),0,005 = 10,597 Þ bác bỏ giả thuyết H Vậy: Ở mức ý nghĩa 0,5 % giả thuyết H bị bác bỏ, nghĩa có mối liên hệ giới tính ưa thích nhãn hiệu nước giải khát 9.5.2 Kiểm định phù hợp Kiểm định phù hợp kiểm định xem giả thuyết phân phối tổng thể số liệu thực tế phù hợp (thích hợp) đến mức độ với giả định phân phối tổng thể Trong kiểm định tham số nghiên cứu, thường gặp phải giả định liệu lấy từ tổng thể có phân phối chuẩn làm để kiểm định liệu chúng có phân phối chuẩn, hay phân phối theo dự kiến Chúng ta dùng kiểm định chi bình phương phù hợp để xác định liệu mẫu có chọn từ tổng thể có phân phối theo giả thuyết hay khơng Dùng kiểm định χ2 bình phương, thực theo bước sau: Bước 1: Thiết lập giả thuyết H H a tổng thể Bước 2: Tính tốn tần số lý thuyết theo giả thuyết H Bước 3: Tính tốn chênh lệch tần số lý thuyết – hay gọi tần số kỳ vọng (E) tần số quan sát thực tế Từ xác định giá trị kiểm định chi bình phương Bước 4: So sánh giá trị kiểm định tính với giá trị bảng phân phối χ2 kết luận 18 a) Kiểm định phù hợp trường hợp giả định biết tham số tổng thể Bài tốn tổng qt: Giả sử có mẫu ngẫu nhiên với n quan sát, quan sát phân vào k nhóm  Gọi O1, O2 …Ok : số quan sát nhóm thứ 1,2, , k  Gọi p1, p2, , pk : xác suất giả thuyết để quan sát rơi vào nhóm thứ 1; 2; …; k (giả thuyết H0) Các xác suất hay không Số lượng quan sát lý thuyết nhóm i , theo giả thuyết H : E i = npi (i = 1, k)  Kiểm định có ý nghĩa E i ³ Với mức ý nghĩa α, kiểm định giả thuyết H thực sau: k Bác bỏ H0 χ = å i=1 (Oi - E i ) > χ 2k- 1,α Ei Trong đó: χ k- 1,α : giá trị tra bảng χ2 với (k – 1) bậc tự Ví dụ: Ở quán bar, có nhãn hiệu bia khác 160 khách hàng chọn ngẫu nhiên cho thấy lựa chọn nhãn hiệu sau Nhãn hiệu A B C D Số khách hàng 34 46 29 51 Có thể kết luận ưa chuộng khách hàng loại bia không mức ý nghĩa 5% Nhãn hiệu A B C D Tổng Số khách hàng (Oi) 34 46 29 51 160 Xác suất theo giả thuyết H 0,25 0,25 0,25 0,25 (pi) Ei = n.pi 40 40 40 40 (Oi- Ei) /Ei 0,9 0,9 3,03 3,03 7,85 (1) Giả thuyết: H0: Sự ưa thích khách hàng loại bia nhau, nghĩa xác suất (tỷ lệ) khách hàng chọn loại bia nhau: pA = pB = pC = pD = 0,25 19 H1: Sự ưa thích loại bia khác nhau, nghĩa xác suất khách hàng chọn lựa loại bia không (2) Giá trị kiểm định χ2 = 7,85 (3) So sánh ta có χ2 = 7,85 < χ k- 1,α = 7,815: bác bỏ giả thuyết H0 Kết luận: mức ý nghĩa 5% ưa chuộng khách hàng loại bia khác b) Kiểm định phù hợp trường hợp chưa biết tham số tổng thể Trong phần nghiên cứu việc kiểm định giả thuyết quan sát tuân theo phân phối Trong trường hợp ta phải xác định pi (xác suất để quan sát rơi vào nhóm thứ i ) Sau áp dụng tương tự phần 20

Ngày đăng: 01/03/2022, 14:51

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w