1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Tài liệu hướng dẫn thống kê y học sử dụng SPSS- KIỂM ĐỊNH Kruskal wallis VN

29 1,2K 6

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 29
Dung lượng 2,24 MB

Nội dung

Như mọi phương pháp phi tham sốkhác, test Kruskal Wallis dựa vào việc xếp thứ hạng chungcủa các cá thể để có phân phối chuẩn, sau đó tính trị sốthống kê H và kiểm tra giả thuyết 0 dựa và

Trang 1

Tài liệu hướng dẫn thống kê y học sử dụng SPSS

Kiểm định Kruskal-Wallis

Trang 2

Lời nói đầu

Mỗi khi nói về test phi tham số, tôi lại nhớ câu chuyện về người bạn học chung lớp năm lớp

12 Đó là một cô gái không có tài năng nào đặc biệt Cô ấy gần như lệch ra khỏi quỹ đạo củachương trình phổ thông, khi luôn bị điểm kém cho tất cả những môn khoa học tự nhiên nhưToán, Lý, Hóa, Sinh… Nhiều lần cô ta trở thành trò cười cho cả lớp vì những phát biểu sailầm ngây thơ và những lỗi hết sức cơ bản Cô giống như hình ảnh con vịt xấu xí bên cạnhnhững người bạn học sinh giỏi khác Thời gian trôi qua, thấm thoát tới hè và ai trong chúngtôi cũng mải mê chạy theo kì thi tuyển sinh đại học Sau mùa thi năm đó, khi hỏi thăm tintức của nhau chúng tôi mới nhận ra sự thực trái ngược hoàn toàn với những gì thầy cô và cảlớp dự đoán Nhiều học sinh giỏi nhất lớp trượt đại học khi thi vào những trường danh giánhư Bách Khoa, Y dược; một số khác đậu vào những nguyện vọng không như ý, nhưng chính

cô bạn mà hằng ngày ai cũng xem thường lại đỗ một trường đại học dân lập, tuy khôngdanh giá, nhưng hoàn toàn phù hợp với những môn xã hội như ngoại ngữ, Văn, là sở trườngcủa cô ta Hơn thế nữa, một thời gian sau cô ấy tham gia một câu lạc bộ thời trang và trởthành khuôn mặt người mẫu nổi tiếng trên báo chí, thậm chí tham gia làm MC trong các sựkiện thể thao, văn nghệ trong giới trẻ Trong khi đó nhiều cô bạn giỏi Toán, Lý, Hóa sau 4năm đại học lại ra làm những công việc văn phòng bình thường, gần như vô danh trong xãhội

Có vẻ như con vịt ta tưởng là xấu xí, chỉ đơn giản vì nó không ở đúng vào thế giới của nó,nếu sống trong môi trường thích hợp nó sẽ hóa thành con thiên nga xinh đẹp

Những test phi tham số cũng vậy Bên cạnh những phương pháp thông dụng như ANOVA,

mô hình hồi quy, test t,… thì test phi tham số phải chịu định kiến và hắt hủi một cách phi lý.Nhiều người cho rằng chúng yếu hơn, lắm nguy cơ sai lầm, hoặc đơn giản là… họ khôngthích, , né tránh sử dụng, và chỉ buộc phải dùng đến khi không còn giải pháp nào khác

Bộ tài liệu này nhằm chuyển đến các bạn một thông điệp giản dị, đó là không có phươngpháp nào dở và xấu, mỗi loại đều có chỗ đứng độc lập của nó Ví dụ test Kruskal Walliskhông chỉ là 1 giải pháp thay thế cho ANOVA, nó là chính nó và trong nhiều trường hợp còn

là giải pháp duy nhất Khi bạn làm nghiên cứu trên một mô hình thực nghiệm động vật nhưtrong thí dụ sau đây, test phi tham số hết sức hữu ích

Chúc các bạn thành công

2

Trang 3

Quy ước trình bày

Trong tài liệu này chúng ta sẽ làm quen với 3 nhân vật

Bác sĩ Nguyễn Văn Thái

Bác sĩ Thái là một cao thủ thống kê y học trên giang hồ Anh ta sẽ xuất hiện trướcmọi vấn đề khó khăn, nhằm đưa ra câu trả lời chính xác và ôn lại cho bạn nhữngkiến thức cơ bản cũng như chuyên sâu về lý thuyết thống kê Tuy nhiên BS Thái lạirất bận rộn nên không đủ thời gian đi vào cách thực hiện chi tiết Anh ta cũng haytrình bày lý thuyết thuần túy và sử dụng nhiều công thức toán học nên không mấygần gũi với sinh viên và gây không ít trở ngại cho các bạn vốn dị ứng với thống kê

Bác sĩ Lê Ngọc Khả Nhi

Khả Nhi là một nữ bác sĩ trẻ dễ thương và sử dụng thành thạo SPSS Như tên

gọi của mình, BS Nhi có tính cách hồn nhiên và ngây thơ như trẻ con, vì vậy

cô ấy luôn có khuynh hướng đơn giản hóa tối đa mọi vấn đề Khả Nhi sẽ

hướng dẫn các bạn sử dụng SPSS qua từng bước cụ thể, chia sẻ những mẹo

vặt, thủ thuật để giúp các bạn đi đến kết quả nhanh và dễ dàng nhất

Sinh viên Trần Quốc Bảo

Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên cứu khoahọc Đây là một cậu sinh viên rất tò mò và luôn đặt ra nhiều câu hỏi liên quanđến thống kê Mặc dù những đế tài do Bảo thực hiện còn đơn giản, nhưngđồng hành với cậu ta, các bạn có cơ hội tích lũy cho mình nhiều kinh nghiệmtrong công việc phân tích số liệu và thiết kế nghiên cứu

3

Trang 4

1 2 3

(1) Phẫu thuật giả (2) (3): Viêm tụy cấp thực nghiệm

(+ Chế độ ăn với Oleuropein x 10 ngày)

Mức độ hoại tử mô tụyAmylase tụy

TNF-alphaIL-6

Y1

Y2

Y3

Y4 Một nhóm nghiên cứu sinh làm thí nghiệm sau để khảo sát tác dụng kháng

viêm của Oleuropein, một chất chiết xuất từ quả Olive trong bệnh lý viêmtụy cấp, dựa vào mô hình thực nghiệm trên chuột

Có 3 phân nhóm chuột (n=10 con cho mỗi nhóm) Nhóm 1 được áp dụngphẫu thuật giả, nhóm 2 được gây viêm tụy cấp thực nghiệm nhưng nhóm 3được cung cấp Oleuropein 20g/kg trong 10 ngày trước khi gây viêm tụycấp thực nghiệm

Sau khi phẫu thuật 24h, những thông số sau đây được khảo sát: Nồng độ một số chất thông tin gây phản ứngviêm: TNF-alpha, Interleukin 6, nồng độ Amylase tụy trong máu, và mức độ hoại tử mô tụy trên giải phẫubệnh Giả thuyết nghiên cứu đặt ra là: Liệu Oleuropein có làm giảm ý nghĩa hiện tượng viêm hệ thống và táchại cục bộ ở mô tụy hay không ? Phương pháp thống kê nào phù hợp nhất cho thiết kế này ?

Nghiên cứu này đòi hỏi phân tích phương sai để so sánh một đại lượng giữa

3 phân nhóm độc lập Tuy nhiên do cỡ mẫu thấp và có biến số thứ hạng, nên

dự tính sẽ không áp dụng được ANOVA Lúc này giải pháp thay thế là test phitham số Kruskal Wallis

1 1.1 Tình huống thí dụ

4

Trang 5

Kiểm định Kruskal-Wallis được thiết lập năm 1952 bởi 2nhà thống kê người Mỹ William kruskal và Wilson Wallis,như một giải pháp phi tham số, thay thế cho phân tíchphương sai (ANOVA) Như mọi phương pháp phi tham sốkhác, test Kruskal Wallis dựa vào việc xếp thứ hạng chungcủa các cá thể để có phân phối chuẩn, sau đó tính trị sốthống kê H và kiểm tra giả thuyết 0 dựa vào phân phối χ2

Kruskal; Wallis (1952) "Use of ranks in one-criterion variance analysis" Journal of the American Statistical Association 47 (260): 583–621.

Hình vẽ sau đây nhằm minh họa một cách đơn giản cho nguyên tắc sosánh đặc tính phân phối giữa 3 phân nhóm A,B,C

Trong thí dụ này, 3 phân nhóm A,B,C có đặc tính phân phối đồng dạng,nhưng lệch nhau, và không chuẩn Khi gộp chung lại với nhau, ta có thểthấy khuynh hướng khác biệt giữa trung vị của A, B và C (Hình (a))Việc xếp hạng là 1 hình thức chuyển dạng biến số để khắc phục vi phạmgiả định phân phối chuẩn Sau khi xếp thứ hạng chung (không phân biệt

cá thể i thuộc về nhóm nào), ta sẽ có histogram thứ hạng, với phân phốichuẩn như hình (b) Lúc này những cá thể có thứ hạng thấp sẽ dồn hết

về bên trái, ngược lại những cá thể hạng cao sẽ dồn về bên phải TrongSPSS có thể thực hiện xếp hạng dễ dàng bằng lệnh Rank

Trang sau sẽ trình bày về công thức tính trị số H trong test Kruskal-Wallis

Lưu ý : Kiểm định Kruskal Wallis yêu cầu một số giả định như sauCác phân nhóm phải độc lập: Y được khảo sát 1 lần duy nhất trênnhững cá thể khác nhau (Kruskall Wallis không áp dụng được chothiết kế khảo sát lặp lại theo thời gian)

Kruskal Wallis có thể áp dụng cho Y là thứ hạng, nhưng không chấpnhận Y có ý nghĩa định tính rời rạc (ví dụ những phân loại bệnh lý khácnhau)

1 1.2 Test Kruskal Wallis

5

Trang 6

Trị số H

Công thức tổng quát : H = (N − 1) i=1k ni ri− r2

i=1

k j=1

𝑛𝑖là số trường hợp trong phân nhóm i (cỡ mẫu của nhóm i)

𝑟𝑖𝑗 là thứ hạng của trường hợp j (sau khi xếp chung tất cả lại, không phân biệtphân nhóm) vốn thuộc về nhóm i

N là tổng số trường hợp ở tất cả phân nhóm, và k là số phân nhóm (hay bậc giá trịcủa

Nếu giả định không có trường hợp trùng hạng trong toàn bộ các phân nhóm, H cóthể ước tính theo cách đơn giản hơn:

Kiểm định Kruskal-Wallis dựa vào trị số H, có phân phối χ2 với độ tự do = (k-1)

Giả thuyết 0: Phân phối thứ hạng là như nhau trong mỗi phân nhóm

Giả thuyết thay thế: Có sự khác biệt về đặc tính phân phối (của thứ hạng) giữa các phân nhóm

Nếu các phân nhóm có phân phối đồng dạng, ta có thể so sánh trung vị với giả thuyết: Có sự khác biệt

về trung vị giữa các phân nhóm

Ghi chú:

+ Test Kruskal Wallis được xem như phân tích phương sai, mặc dù nó không bắt buộc thứ hạng phảiphân phối chuẩn, nhưng nó vẫn đòi hỏi giả định phương sai đồng nhất (của thứ hạng) Cách kiểm tragiả định này là dùng lệnh Rank để xếp thứ hạng trong SPSS, sau đó dùng lệnh Explore với test Levene.+ Sau khi xếp thứ hạng, bạn vẫn có thể làm ANOVA trên chính giá trị thứ hạng này Cách làm này sẽ cho

ra kết quả tương đương với test Kruskal Wallis

1 1.2 Test Kruskal Wallis

6

Trang 7

Loại biến số

Định lượngliên tục

Không liên tục(Thứ hạng)

Không ANOVA đơn biến

So sánh 1 đại lượng giữa ≥ 3 phân nhóm

Kruskal-Wallis Xếp thứ hạng

1 1.3 Test Kruskal Wallis (không chỉ) là một giải pháp thay thế cho ANOVA đơn biến

Ứng dụng của kiểm định H theo Kruskal-Wallis

1 Thay thế cho phân tích phương sai 1 yếu tố (ANOVA đơn biến) trong trường hợp : cỡ mẫu quá thấp, có viphạm các giả định về phân phối chuẩn và/hoặc có những điểm giá trị cá biệt Bản thân Kruskall Wallis đượcxem như 1 hình thức phân tích phương sai (ANOVA), cho phép so sánh đặc tính phân phối (hoặc trung vị) của Ygiữa nhiều (≥3) phân nhóm độc lập

2 Bắt buộc sử dụng test Kruskal Wallis khi đại lượng cần so sánh là một biến số không liên tục (thứ hạng, thangđiểm, giả định lượng)

Thí dụ:

Những nghiên cứu thuộc chuyên khoa chẩn đoán hình ảnh, giải phẫu bệnh lý thường dùng nhiều biến thứ hạng.Các nghiên cứu dùng thang điểm, bảng câu hỏi… (ví dụ thăm dò chức năng giấc ngủ, mức độ đau, chất lượng cuộcsống…)

Những mô hình thí nghiệm trên động vật, tế bào, mô Các thí nghiệm Western-Blot, hóa mô miễn dịch (do cỡ mẫuquá nhỏ, và/hoặc giá trị không liên tục)

F Biến số F, thuộc loại định tính (≥ 3 giá trị) dùng để phân nhóm

Y Biến số Y, giá trị của đại lượng cần so sánh Y có thể là

biến định lượng liên tục, hoặc giả định lượng (thứhạng)

Y

7

Trang 8

Ghi chú:

+ Sau khi xếp hạng, phân phối của Y xem như được chuẩn hóa, bạn vẫn có thế sử dụng ANOVA đơn biến nếuthích, tuy không chính xác bằng mô hình theo thang đo định lượng liên tục Ngược lại, test Kruskal Wallis vẫn cầngiả định về đồng nhất phương sai

+ Ngay cả khi số liệu phân phối chuẩn, không có điểm cá biệt, bạn vẫn có thể dùng test Kruskal-Wallis, lúc này nóđược xem như 1 phương pháp độc lập, không chỉ thay thế cho ANOVA Bản thân test Kruskal-Wallis dựa trên giảthuyết 0 về đặc tính phân phối, nên cho ra kết luận phổ quát hơn mô hình ANOVA chỉ cho phép chứng minh hiệuứng ý nghĩa của yếu tố F lên giá trị trung bình của Y Trong trường hợp ANOVA cho ra kết quả không rõ nét, bạn

có thể cân nhắc dùng test Kruskal Wallis với hy vọng tìm ra sự khác biệt (vì ít bảo thủ hơn)

+Ý nghĩa của 2 quy trình hoàn toàn khác nhau, nên cách diễn giải sẽ khác nhau ANOVA dựa vào mô hình hồi quytuyến tính và so sánh nhiều giá trị trung bình; test Kruskal Wallis dựa vào thứ hạng và so sánh đặc tính phân phối(hay trung vị)

Một khi đã dùng test Mann-Whitney bạn cần phải mô tả đặc tính phân phối của 2 phân nhóm (Trung vị,Skewness, Kurtosis, bách phân vị, tứ phân vị…) thay vì dùng trung bình và độ lệch chuẩn, sai số chuẩn nhưthường lệ

1 1.3 Test Kruskal Wallis (không chỉ) là một giải pháp thay thế cho ANOVA đơn biến

8

Trang 9

Khảo sát đặc tính phân phối của Y ở mỗi phân

nhóm

Tính các giá trị: Trung vị, Skewness, KurtosisKiểm tra giả định phân phối chuẩn của Y ở mỗiphân nhóm, phát hiện điểm giá trị cá biệt

Vẽ biểu đồ histogram cho mỗi phân nhóm

So sánh đặc tính phân phối giữa chúng

Giả thuyết 0 được phát biểu tùy theo tínhđồng dạng hay không giữa 2 phân phối…

Xếp hạng, tính trị số H, kiểm tra giả thuyết 0

Phân tích sâu: Test post-hoc

Nếu p<0,05; ta cần thực hiện so sánh bắt cặptuần tự giữa các phân nhóm Có nhiều phươngpháp để làm việc này:

+ Đơn giản nhất (nhưng cũng yếu nhất) là làmMann-Whitney tuần tự cho từng cặp phânnhóm

+ Kinh điển: Kiểm định Dunn (1964) – SPSS sửdụng quy trình này

+ Hiện đại: Dwass-Steel-Critchlow-Fligner hoặcConover-Inman (1991) (không được hỗ trợtrong SPSS)

SPSS cho phép thực hiện test kruskal Wallis theo 2 quy trình:

Những phiên bản cũ (17 trở về trước) áp dụng quy trình cũ, bạn phải tự xác định loại test cần sửdụng, sau đó thiết lập một số tùy chỉnh thống kê Kết quả được xuất thẳng ra dưới dạng bảng Tuynhiên quy trình cũ có nhiều nhược điểm, ví dụ không làm được test Post-hoc, thay vào đó bạn phảilàm thủ công test Mann-Whitney hàng loạt để so sánh bắt cặp 2 phân nhóm

Quy trình mới có nhiều ưu điểm hơn: Tự động xác định loại test phi tham số phù hợp với số liệu bạnđưa vào, phần kết quả chi tiết hơn, bao gồm biểu đồ Box-plot, test post-hoc theo Dunn (1964) hoặctest tương phản phân nhóm (Step-wise)

Chú ý:

+ Test Kruskal Wallis không cho phép tính hệ số ảnh hưởng (effect size) r trực tiếp, tuy nhiên có thểtính được r thông qua Z của test Mann-Whitney hay Dunn, theo công thức:

𝑟 = 𝑍/ 𝑁+ Thực ra phương pháp Dunn chưa phải là cách tối ưu để thực hiện post-hoc test, còn 2 phương pháphiện đại hơn là Dwass-Steel-Critchlow-Fligner và Conover-Inman, rất tiếc là SPSS không hỗ trợ 2phương pháp này Hiện nay chỉ có R và XLSTAT cho phép thực hiện 2 test này

2 2.1 Quy trình làm test Kruskal Wallis trong SPSS

Dunn, O J (1964) Multiple comparisons using rank sums Technometrics, 6, 241-252. 9

Trang 10

Click chuột trái 2 lần vào icon

của file syntax, cửa sổ Syntax

Để thực hiện riêng 1 khối lệnh bất kì:

1° Đánh dấu chọn nội dung khối lệnh cần thihành

2° Nhấp chuột phải để mở Menu, chọn RunSelection

Trong thí dụ này, trước hết chúng ta tạo 1 data base gồm 5 biến số

như trong hình vẽ: Biến Y1,Y2,Y3,Y4 lần lượt chỉ 4 đại lượng cần khảo

sát là : Amylase tụy, IL-6, mức độ hoại tử mô, TNF-alpha Chú ý: Mặc

dù Y3 là biến thứ hạng nhưng ta vẫn đặt Measure = Scale, vì nếu

không SPSS không thể so sánh được

Biến F= Phân nhóm , thuộc loại định tính, nhiều giá trị (Nominal),

nhận 3 giá trị: 1=Nhóm 1, 2=Nhóm 2, 3=Nhóm 3

Sau khi nhập số liệu, bạn tải file Syntax về máy và mở nó lên:

2 2.2 Tạo bảng số liệu và sử dụng syntax

10

Trang 11

*Bước 1A: Thăm dò số liệu

*Bước 1B: Thăm dò sau khi xếp hạng

RANK VARIABLES=Y1 Y2 Y3 Y4 (A)

/RANK

/PRINT=YES

/TIES=MEAN.

EXAMINEVARIABLES= RY1 RY2 RY3 RY4 BY F

/PLOT BOXPLOT NPPLOT SPREADLEVEL(1)

DELETE VARIABLES RY1 RY2 RY3 RY4

Khối lệnh bước 1A có nội dung thăm dò số liệu, baogồm:

Bảng thống kê mô tả, tính giá trị trung vị, skewness,kurtosis (Xem tài liệu về test Mann Whitney để rõcông dụng những trị số này)

Đồng thời làm test Shapiro-Wilk để kiểm tra giả địnhphân phối chuẩn

Và vẽ Box-plot để phát hiện giá trị ngoại lai

Ghi chú: Box-plot có thể dùng để báo cáo kết quả nếu

Y là biến liên tục Một dạng biểu đồ khác phổ quát vàchính xác hơn là scatter dot, sẽ được vẽ trong bước1C

Cuối cùng là test evene để kiểm tra giả định vềphương sai đồng nhất

Khối lệnh bước 1B chỉ nhằm mục đích minh họa cho ýtưởng: Sau khi xếp thứ hạng xong, những biến số cóphân phối không bình thường (như kết quả testShapiro-Wilk bước 1A cho thấy ) sẽ được chuẩn hóa,

và có phân phối (thứ hạng) bình thường

Bước 1B còn dùng để kiểm tra giả định về đồng nhấtphương sai bằng test Levene, là điều kiện cho phép sosánh trung vị bằng Kruskal Wallis, và làm ANOVA đơnbiến trên biến số sau khi xếp hạng

2 2.3 Nội dung syntax

11

Trang 12

*Bước 1C: Vẽ biểu đồ so sánh giữa các phân nhóm cho Y1

DATA: F =col(source(s), name(" F "), unit.category())

DATA: Y1 =col(source(s), name(" Y1 "))

GUIDE: axis(dim(1), label(" Phân nhóm "))

GUIDE: axis(dim(2), label(" Amylase tụy (IU/L) "))

SCALE: linear(dim(2), include(0))

ELEMENT: point(position( F*Y1 ))

DATA: F=col(source(s), name("F"), unit.category())

DATA: Y3=col(source(s), name("Y3"))

GUIDE: axis(dim(1), label("Phân nhóm"))

GUIDE: axis(dim(2), label("Mức độ hoại tử mô/GPB"))

SCALE: cat(dim(1), include("1", "2", "3"))

SCALE: linear(dim(2), include(0))

ELEMENT: point(position(F*Y3))

END GPL

Nội dung khối lệnh bước 1C là để vẽ biểu đồscatter dots plot cho phép so sánh trực quan phânphối giá trị Y giữa các phân nhóm Trục hoành chỉphân nhóm (F), mỗi cá thể là 1 điểm giá trị.Cách làm này chính xác hơn biểu đồ Box-Plots màSPSS cung cấp kèm theo test Kruskal Wallis.Chú ý: Thay đổi tên biến Y và nội dung trục tung,trục hoành cho phù hợp với nghiên cứu của bạn

Nếu Y là 1 biến thứ hạng (không liên tục), bạn nhớthêm dòng lệnhSCALE: cat(…)

2 2.3 Nội dung syntax

12

Trang 13

*Bước 2A: Kruskal-Wallis theo quy trình mới

với so sánh bắt cặp hàng loạt theo phương pháp Dunn

/CRITERIA ALPHA=0.05 CILEVEL=95.

*Bước 2B: Kruskal Wallis theo quy trình cũ,

với Post hoc test sử dụng Mann-Whitney hàng loạt

*Bước 2C: Kruskal-Wallis theo quy trình mới,

bao gồm test tương phản

NPTESTS

/INDEPENDENT TEST (Y1 Y2 Y3 Y4) GROUP (F)

KRUSKAL_WALLIS(COMPARE=STEPWISE)

/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE

/CRITERIA ALPHA=0.05 CILEVEL=95

*Bước 3: ANOVA đơn biến cho thứ hạng

RANKVARIABLES= Y1 Y2 Y3 Y4 (A)

/RANK

/PRINT=YES

/TIES=MEAN.

ONEWAY RY1 RY2 RY3 RY4 BY F

/STATISTICS EFFECTS HOMOGENEITY

/MISSING ANALYSIS

/POSTHOC=BONFERRONI GH ALPHA(0.05).

DELETE VARIABLES RY1 RY2 RY3 RY4

Test kruskal Wallis có thể thực hiện theo quy trình mới

và cũ Quy trình mới có nhiều ưu điểm hơn, vì tự độnglựa chọn loại test phi tham số phù hợp với thiết kế biến

số (Ví dụ khi F có 2 giá trị, SPSS sẽ chọn test Mann Whitney, F có 3 giá trị, SPSS sẽ làm test Kruskal Wallis Hơn nữa, quy trình mới cho phép làm post hoc test (không được hỗ trợ trong quy trình cũ)

Khối lệnh 2A có nội dung: Làm test Kruskal Wallis và post hoc test theo Dunn (1964)

Khối lệnh 2B có nội dung thực hiện test Kruskal Wallistheo quy trình cũ, sau đó làm test Mann-Whitney hàngloạt để so sánh bắt cặp tuần tự giữa các phân nhóm: F=1

vs F=2, F=1 vs F=3 và F=2 vs F=3

Nhược điểm duy nhất là cách làm này không cho phéphiệu chỉnh theo Bonferonni, nên chỉ thích hợp cho K=3.Nếu bạn có từ 4 phân nhóm trở lên, nên sử dụng quytrình mới

Khối lệnh 2B có nội dung thực hiện test Kruskal Wallistheo quy trình mới, nhưng thay vì làm test Post-hoc thì sẽphân tích tương phản để phân lớp giá trị cho các phânnhóm Cách làm này cho phép nhận diện nhanh sự tươngphản khi có nhiều nhóm, nhưng không phải lúc nào cũngtính ra được giá trị p, nên bất tiện hơn so với PP Dunn

Khối lệnh bước 3 chỉ nhằm mục đích minh họa cho ýtưởng: Có thể làm ANOVA đơn biến cho số liệu đã xếphạng Thông thường kết quả sẽ như nhau so với KruskalWallis Nhưng cách làm này không chính thống và có thểgây hiểu nhầm nếu diễn giải không đúng

Ghi chú: Trong thực tế bạn chỉ cần làm duy nhất bước 2A Những bước còn lại chỉ có ý nghĩa minh họa.Lưu ý thay đổi nội dung màu đỏ trong các dòng lệnh để phù hợp với nghiên cứu của bạn Với:

Y1,Y2,Y3,Y4 là tên các biến cần so sánh, F là biến số phân nhóm

Nếu nghiên cứu của bạn có ít biến số hơn, hãy xóa bớt Y, nếu nhiều hơn, bạn có thể thêm tuần tự Y5,Y6…

Nếu bạn có nhiều phân nhóm (ví dụ 4,5), thay đổi các dòng lệnh liên quan tới F trong bước 2B

Nói chung chỉ có khối lệnh 2B là hơi phức tạp, còn lại đều đơn giản

2 2.3 Nội dung syntax

13

Trang 14

3 3 Diễn giải kết quả 3.1 Kiểm tra giả định phân phối bình thường

Tests of Normality

Phân nhóm Kolmogorov-Smirnov a Shapiro-Wilk

Statistic df Sig Statistic df Sig.

Amylase tụy (IU/L)

* This is a lower bound of the true significance.

a Lilliefors Significance Correction

Thông thường khi so sánh giữa nhiều phân nhóm, chúng ta sẽ kiểm tra 2 giả định về phân phốichuẩn, giá trị cá biệt Nếu chúng được thỏa mãn, bạn có thể làm ANOVA Nhưng nếu có sự viphạm, vấn đề sẽ khó khăn hơn một chút, có thể bạn phải chuyển dạng biến số với hy vọng sẽ cóphân phối chuẩn Test phi tham số là giải pháp cuối cùng khi tất cả hình thức chuyển dạng đãthất bại

Do đó, trong tài liệu này chúng ta cũng đi tuần tự theo các bước, bắt đầu bằng kiểm tra số liệu.Nếu bạn thực hiện thăm dò với khối lệnh bước 1, bạn sẽ thấy bảng kết quả test Shapiro-Wilk,chỉ cần đọc giá trị p ở cột cuối cùng Giá trị trông đợi là p>0,05 (có phân phối bình thường).Ngược lại p<0,05 tức là phân phối không bình thường

Chú ý: Nếu cỡ mẫu đủ lớn (>50) bạn có thể dùng Q-Q plot một cách trực quan để kết luận vềphân phối chuẩn (xem thêm các tài liệu về ANOVA)

Trong trường hợp này, có 2 biến số vi phạm giả định về phân phối chuẩn: Amylase tụy (Y1) vàMức độ hoại tử (Y3) Trong đó Y3 là biến thứ hạng nên vi phạm không nằm ngoài dự tính Dùsao với biến thứ hạng thì hiếm khi có thể dùng ANOVA, test Kruskal Wallis là giải pháp tối ưucho loại biến này

Với 2 biến Y2 (IL-6) và TNF-alpha (Y4): Chúng thỏa giả định phân phối bình thường, nên bạn cóquyền dùng ANOVA để phân tích cho 2 biến này Tuy nhiên trong tài liệu này tác giả áp dụngKruskal Wallis cho toàn bộ 4 biến số, trước hết bởi vì cỡ mẫu ở đây quá nhỏ (n=10) nên testShapiro-Wilk không đáng tin cậy, thứ hai là để minh họa cho ý tưởng : Không nên xem thườnghay né tránh test phi tham số và chỉ dùng nó như giải pháp thay thế, thực ra bạn hoàn toàn cóthể dùng nó bất cứ khi nào bạn thích Test Kruskal Wallis không chỉ là một giải pháp thay thế, nó

là chính nó và hoàn toàn có thể đứng độc lập 1 mình trong mọi trường hợp

14

Ngày đăng: 22/03/2016, 22:37

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w