1. Trang chủ
  2. » Giáo Dục - Đào Tạo

PHÉP KIỂM PHI THÔNG SỐ (Non-parametric tests) pot

24 616 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 24
Dung lượng 258,62 KB

Nội dung

PHÉP KIỂM PHI THÔNG SỐ (Non-parametric tests) I. GIỚI THIỆU Kỹ thuật kiểm định thống kê có thông số (parametric tests) thường đòi hỏi 1 số giả định (assumptions) về dân số được khảo sát, đặc biệt nhất là tính phân phối bình thường, biến số được đo ở thang khoảng (interval) hoặc thang tỉ số (ratio), và mẫu ngẫu nhiên và độc lập. Ngược lại, kỹ thuật kiểm định phi thông số không đòi hỏi giả định về tính phân phối bình thường của dân số (do vậy còn được gọi là phép thống kê phân phối tự do –distribution-free statistics). Kỹ thuật kiểm định phi thông số có thể được sử dụng để phân tích số liệu về dân số đo lường ở thang định danh, thang thứ tự, thang khoảng, và/hoặc thang tỉ số. Kỹ thuật này cũng được sử dụng khi cỡ mẫu nhỏ (≤ 30) hoặc khi có nhiều giá trị cực trong tập hợp số liệu. Đặc biệt, kỹ thuật được sử dụng khi dạng phân phối của dân số khảo sát không được biết hoặc được biết là phân phối không bình thường. Kỹ thuật kiểm định phi thông số có thể được sử dụng để kiểm định giả thuyết về: + Mối liên quan giữa các biến số + Mối liên quan giữa các biến số trong các mẫu cặp đôi (paired samples) + Mối liên quan giữa các biến số trong hai mẫu độc lập + Mối liên quan giữa các biến số trong ≥ 3 mẫu độ lập. II. PHÉP KIỂM CHI-SQUARE (Bổ sung) 1/ Hệ số Phi (Phi coefficient) Đo độ mạnh của mối liên quan giữa 2 biến số (trong phép kiểm Chi-square) trong bảng 2x2 2 / n    Hệ số Phi cũng được diễn đạt như hệ số tương quan Pearson r, nhưng chỉ biến thiên trong khoảng 0 đến 1. 2/ Hệ số Cramér’s V Đo độ mạnh của mối liên quan giữa 2 biến số (trong phép kiểm Chi-square) trong bảng lớn hơn bảng 2x2 Cramér’s V = 2 / ( 1) N m   m : số nhỏ hơn trong số hàng hoặc cột của bảng RxC Hệ số Cramér’s V biến thiên từ 0 đến 1. Ngưỡng có ý nghĩa thống kê cũng giống như của χ 2 . III. McNEMAR TEST Là một biến thể của χ 2 test với 1 độ tự do. Được sử dụng khi số liệu ở dạng cặp đôi và được đo lường ở thang định danh. Các giả định của McNemar test: + Số liệu dạng nhị phân. + Các số đo nhị phân là những cặp giá trị đo được từ cùng 1 đối tượng hoặc đối tượng đã được bắt cặp (matched pairs). + Các lớp nhị phân độc lập hỗ tương với nhau (mutually exclusive). + Số liệu trong các ô (celss) của bảng là số cặp đếm được. Thí dụ minh hoạ: Nhà nghiên cứu muốn so sánh thái độ của học viên trước khi ghi danh và sau khi tốt nghiệp khoá trung cấp chuyên nghiệp về Quản lý thông tin sức khoẻ (HIM). 50 học viên được đề nghị trả lời bảng khảo sát về thái độ ở thời điểm trước khi ghi danh và ở thời điểm 1 tuần sau khi tốt nghiệp. Các trả lời được ghi nhận là tích cực hoặc tiêu cực (nhị phân). Sau khi tốt nghiệp Trước khi ghi danh (+) (–) Toång Döông tính 38 (a) 05 (b) 43 AÂm tính 02 (c) 05 (d) 07 Toång 40 10 50 (a) = dương tính trước và sau (không đổi) (c) = thay đổi từ âm sang dương tính (b) = thay đổi từ dương sang âm tính (d) = Âm tính trước và sau (không đổi) Giả thuyết H 0 : thái độ trước ghi danh = thái độ sau tốt nghiệp. H A : thái độ trước ghi danh ≠ thái độ sau tốt nghiệp. Công thức tính số TKKĐ McNemar χ 2 : McNemar χ 2 = (b – c– 1) 2 /(b + c) = (5 – 2– 1) 2 /(5 + 2) = 0,57 Giá trị tới hạn của χ 2 với α = 0,05 ở 01 độ tự do là 3,841. Không thể từ chối H 0 vì số TKKĐ nhỏ hơn giá trị tới hạn. Giá trị p = 0,453 Không có sự thay đổi về thái độ của học viên ở thời điểm trước ghi danh và ở thời điểm sau tốt nghiệp. IV. SPEARMAN RHO (The Spearman Rho Rank Order Correlation Coefficient) Spearman rho test được sử dụng khi ít nhất 1 trong 2 biến số khảo sát được đo lường ở thang thứ tự. Hệ số tương quan tính được từ kỹ thuật Spearman rho là kết quả của việc xếp hạng các số liệu, mà không dùng giá trị thực của chúng. Để tính Spearman rho, chuỗi thống kê được xếp hạng từ thấp đến cao. Các giá trị bằng nhau (tied observations) được xếp hạng ngang nhau, tính bằng trung bình các thứ hạng của chúng. Thí dụ : Giá trị đo được : 2 5 5 5 7 Xếp hạng(dự kiến) : 1 2 3 4 5 Xếp hạng (đúng) : 1 3 3 3 5 Sau khi đã xếp hạng, hiệu giữa các thứ hạng của biến số X và Y sẽ được tính, tổng lại, và bình phương lên, và được sử dụng để tính số TKKĐ r rho r rho = 1– [(6 ΣD 2 )/n(n 2 – 1)] Spearman rho có biến thiên và cách diễn đạt giống như Pearson r. Thí dụ minh hoạ 1: Khảo sát trên 08 bệnh nhân Số điếu thuốc hút Độ nặng của bệnh Hiệu của thứ hạng B/n R 1 R 2 D(R 1 – R 2 ) D 2 1 1 2 –1 1 2 2 4 –2 4 3 3 3 0 0 4 4 1 3 9 5 5 7 –2 4 6 6 5 1 1 7 7 8 –1 1 8 8 6 2 4 R 1 : thứ hạng của từng b/n xét theo số điếu thuốc lá đã hút, thấp nhất (=1), nhiều nhất (=8). R 2 : thứ hạng của từng b/n xét theo độ nặng của bệnh, nhẹ nhất (=1), nặng nhất (=8). Giả thuyết : H 0 : Không có mối liên quan giữa số điếu thuốc hút và độ nặng của bệnh. H A : Có mối liên quan giữa số điếu thuốc hút và độ nặng của bệnh. Tính Spearman rho: r rho = 1– [(6 ΣD 2 )/n(n 2 – 1)] = 1– [6 (24)]/[8(64 – 1)] = 0,71 Kiểm định Spearman rho của dân số Số TKKĐ : t = rho 2 2 / 1 n rho   = 0,71 2 6 / 1 0,71  = 1,74/0,7 = 2,49 Với 06 độ tự do, α = 0,05, giá trị tới hạn của t là 2,447. Từ chối H 0 vì số TKKĐ lớn hơn giá trị tới hạn (2,49 > 2,447). Kết luận : Có mối liên quan thuận chiều (có ý nghĩa thống kê) giữa số điếu thuốc lá hút và độ nặng của bệnh. Spearman rho test cũng được sử dụng trong trường hợp có 1 biến số ở thang khoảng. Tuy nhiên, các giá trị của biến số này phải được chuyển thành thứ hạng trước khi tính toán. X Y Hiệu của thứ hạng B/n R 1 R 2 D(R 1 – R 2 ) D 2 1 8,5 135 6,5 2 8,5 120 9 3 6 140 5 4 6 130 8 5 6 135 6,5 6 4 145 4 7 3 150 2,5 8 1,5 150 2,5 9 1,5 160 1 V. SIGN TEST Thường được sử dụng để đánh giá số liệu ở dạng cặp đôi (matched pairs) của 1 mẫu khảo sát. Sign test không đòi hỏi dân số khảo sát phải phân phối bình thường. Giả thuyết trống của sign test được phát biểu: P(X i > Y i ) = P(X i < Y i ) = 0,5 Trong 1 cặp, lấy X i trừ cho Y i . Nếu Y i nhỏ hơn X i , dấu của hiệu số sẽ là dấu cộng (+), và nếu Y i lớn hơn X i , dấu của hiệu số sẽ là dấu trừ (–). Nếu số trung vị hiệu bằng 0, số dấu (+) và số dấu (–) ở 2 bên số trung vị sẽ bằng nhau. Như vậy, giả thuyết trống có thể được phát biểu : H 0 : P(+) = P(–) = 0,5 Số TKKĐ là S và bằng số dấu (+) đếm được trong các hiệu tính được từ các cặp. Nếu H 0 đúng, S có phân phối nhị phân với n và p=0,5. p(S=x) = (0,5) (0,5) n x n x x C  Thí dụ minh họa: Một nhóm nghiên cứu về răng muốn biết liệu việc hướng dẫn chải răng đúng cách có mang lại hiệu quả gì không. 12 cặp b/n đến khám tại khoa Nha được chọn kỹ càng để bắt cặp với nhau theo tuổi, phái, trình độ học vấn, và điểm vệ sinh răng khám lúc ban đầu. Một thành viên của mỗi cặp được hướng dẫn cách chải răng và những vấn đề vệ sinh răng khác. Sáu tháng sau, 24 đối tượng được khám và [...]... Không được hướng dẫn số (Xi) (Yi) 1 1,5 2,0 2 2,0 2,0 3 3,5 4,0 4 3,0 2,5 5 3,5 4,0 6 2,5 3,0 7 2,0 3,5 8 1,5 3,0 9 1,5 2,5 10 2,0 2,5 11 3,0 2,5 12 2,0 2,5 Giả thuyết H0 : Số trung vị hiệu bằng zero [P(+) = P(–)] HA : Số trung vị hiệu là số âm [P(+) < P(–)] Tính số TKKĐ : với np và n(1–p) đều lớn hơn 5, dùng z test với z= S  0,5n  0,5 0,5 n n = 11 (do có 1 hiệu bằng 0) ± 0,5 là hệ số điều chỉnh khi... thời gian phản ứng ở 3 dân số đại diện bởi 3 mẫu động vật thí nghiệm này không? Thời gian phản ứng ở 13 động vật thí nghiệm Mẫu I II III 17 8 2 20 7 5 40 9 4 31 8 3 35 Giả thuyết: H0: Số trung vị của 3 dân số đều bằng nhau HA: Có ít nhất một cặp số trung vị (từ 3 dân số ) khác nhau α = 0,01 Thời gian phản ứng thay bằng ranks Mẫu I II III 9 6,5 1 10 5 4 13 8 3 11 6,5 2 12 R1= 55 Số TKKĐ: R2 = 26 R3 = 10... 15,0 16,6 16,0 15,9 16,9 15,6 15,0 14,1 16,3 15,3 16,8 15,7 16,7 13,7 15,3 14,0 Giả thuyết: H0: MX ≥ MY HA: MX < MY α = 0,05 MX là số trung vị của dân số vật thí nghiệm được cho hít cadmium oxide MY là số trung vị của dân số vật thí nghiệm không được cho hít cadmium oxide Số liệu ban đầu và thứ hạng (Nồng độ Hemoglobin (grams) của 25 con vật thí nghiệm) X Rank 13,7 1 13,8 2 14,0 3 14,1 4,5 14,1 4,5... n(n  1) j 1 n j k: số mẫu (khảo sát) nj: số giá trị (đo được) trong mẫu thứ j Rj: tổng các thứ hạng trong mẫu thứ j n: tổng số giá trị (đo được) của các mẫu Qui tắc quyết định: Từ chối H0 nếu giá trị tính được của H lớn đến mức giá trị p tìm thấy nhỏ hơn α (0,01) Giả thuyết trống hàm ý rằng tất cả các giá trị đo được trong 3 mẫu hình thành nên 1 mẫu đơn có n = 13 rút ra từ 1 dân số đơn Nếu điều này... –1,809) = 0,0359 < 0,05 (ά) Từ chối H0 với p = 0,035 Trung vị hiệu là số âm Việc hướng dẫn có hiệu quả VI MANN-WHITNEY WILCOXON TEST Khi so sánh các mẫu độc lập mà các giả định để được sử dụng student’s t test không thỏa thì Mann-Whitney Wilcoxon test (Mann-Whitney U test) là lựa chọn thay thế Trong test này, số trung vị của 2 dân số, X và Y, được so sánh với nhau Test sử dụng các thứ hạng (ranks) của... và sẽ chia đều cho 2 nhóm (trường hợp cỡ mẫu bằng nhau– tổng thứ hạng của mỗi nhóm là 325/2 (MX = MY) ; hoặc tổng các thứ hạng của X sẽ lớn hơn tổng các thứ hạng của Y (MX > MY) Số TKKĐ: T= S n( n  1) 2 n: số mẫu X S : tổng số thứ hạng thuộc mẫu X (S có thể chọn tùy ý là của X hoặc Y) Qui tắc quyết định: Từ chối H0 nếu giá trị tính được của T nhỏ hơn giá trị tới hạn  (tra được) ở n = 15, m =10, và... các giả định để được sử dụng One-way ANOVA test không thỏa thì Kruskal-Wallis là lựa chọn thay thế Kruskal-Walis test đòi hỏi các mẫu phải độc lập lập và có ≥ 3 nhóm (k ≥ 3) Trong test này, số trung vị của các dân số được so sánh với nhau Test sử dụng các thứ hạng (ranks) của những giá trị đo được từ các mẫu và sắp xếp lại như trong 1 mẫu Trong Kruskal-Wallis test, giả thuyết trống được phát biểu: H0:... nghiên cứu thiết kế một thí nghiệm nhằm đánh giá tác dụng của việc hít dài lâu chất Cadmium Oxide Nhà nghiên cứu sử dụng 15 con vật thí nghiệm cho nhóm thực nghiệm và 10 con tương tự làm nhóm chứng Biến số có liên quan là nồng độ hemoglobin Nhà nghiên cứu muốn biết liệu có thể kết luận rằng việc hít dài lâu cadmium oxide có làm giảm nồng độ hemoglobin Nồng độ Hemoglobin (grams) của 25 con vật thí nghiệm...    = 10,68 Tra bảng với nj là 5, 4, và 4, xác suất tìm thấy giá trị của H ≥ 10,68 thì nhỏ hơn 0,009 Từ chối H0 ở ngưỡng (có ý nghĩa thống kê) 0,01 Có sự khác biệt về thời gian phản ứng trong 3 dân số p < 0,009 Khi có 3 mẫu và mỗi mẫu có ≤ 5 giá trị, giá trị p (của H tính được) được tìm ra bằng cách tra bảng Khi có > 5 giá trị trong 1 hay nhiều mẫu, H được xem như phân phối χ2 dạng đặc biệt với . PHÉP KIỂM PHI THÔNG SỐ (Non-parametric tests) I. GIỚI THIỆU Kỹ thuật kiểm định thống kê có thông số (parametric tests) thường đòi hỏi 1 số giả định (assumptions) về dân số được. thường của dân số (do vậy còn được gọi là phép thống kê phân phối tự do –distribution-free statistics). Kỹ thuật kiểm định phi thông số có thể được sử dụng để phân tích số liệu về dân số đo lường. không bình thường. Kỹ thuật kiểm định phi thông số có thể được sử dụng để kiểm định giả thuyết về: + Mối liên quan giữa các biến số + Mối liên quan giữa các biến số trong các mẫu cặp đôi

Ngày đăng: 26/07/2014, 16:21

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w