Như mọi phương pháp phi tham sốkhác, test Kruskal Wallis dựa vào việc xếp thứ hạng chungcủa các cá thể để có phân phối chuẩn, sau đó tính trị sốthống kê H và kiểm tra giả thuyết 0 dựa và
Trang 1Tài liệu hướng dẫn thống kê y học sử dụng SPSS
Kiểm định Kruskal-Wallis
Trang 2Lời nói đầu
Mỗi khi nói về test phi tham số, tôi lại nhớ câu chuyện về người bạn học chung lớp năm lớp
12 Đó là một cô gái không có tài năng nào đặc biệt Cô ấy gần như lệch ra khỏi quỹ đạo củachương trình phổ thông, khi luôn bị điểm kém cho tất cả những môn khoa học tự nhiên nhưToán, Lý, Hóa, Sinh… Nhiều lần cô ta trở thành trò cười cho cả lớp vì những phát biểu sailầm ngây thơ và những lỗi hết sức cơ bản Cô giống như hình ảnh con vịt xấu xí bên cạnhnhững người bạn học sinh giỏi khác Thời gian trôi qua, thấm thoát tới hè và ai trong chúngtôi cũng mải mê chạy theo kì thi tuyển sinh đại học Sau mùa thi năm đó, khi hỏi thăm tintức của nhau chúng tôi mới nhận ra sự thực trái ngược hoàn toàn với những gì thầy cô và cảlớp dự đoán Nhiều học sinh giỏi nhất lớp trượt đại học khi thi vào những trường danh giánhư Bách Khoa, Y dược; một số khác đậu vào những nguyện vọng không như ý, nhưng chính
cô bạn mà hằng ngày ai cũng xem thường lại đỗ một trường đại học dân lập, tuy khôngdanh giá, nhưng hoàn toàn phù hợp với những môn xã hội như ngoại ngữ, Văn, là sở trườngcủa cô ta Hơn thế nữa, một thời gian sau cô ấy tham gia một câu lạc bộ thời trang và trởthành khuôn mặt người mẫu nổi tiếng trên báo chí, thậm chí tham gia làm MC trong các sựkiện thể thao, văn nghệ trong giới trẻ Trong khi đó nhiều cô bạn giỏi Toán, Lý, Hóa sau 4năm đại học lại ra làm những công việc văn phòng bình thường, gần như vô danh trong xãhội
Có vẻ như con vịt ta tưởng là xấu xí, chỉ đơn giản vì nó không ở đúng vào thế giới của nó,nếu sống trong môi trường thích hợp nó sẽ hóa thành con thiên nga xinh đẹp
Những test phi tham số cũng vậy Bên cạnh những phương pháp thông dụng như ANOVA,
mô hình hồi quy, test t,… thì test phi tham số phải chịu định kiến và hắt hủi một cách phi lý.Nhiều người cho rằng chúng yếu hơn, lắm nguy cơ sai lầm, hoặc đơn giản là… họ khôngthích, , né tránh sử dụng, và chỉ buộc phải dùng đến khi không còn giải pháp nào khác
Bộ tài liệu này nhằm chuyển đến các bạn một thông điệp giản dị, đó là không có phươngpháp nào dở và xấu, mỗi loại đều có chỗ đứng độc lập của nó Ví dụ test Kruskal Walliskhông chỉ là 1 giải pháp thay thế cho ANOVA, nó là chính nó và trong nhiều trường hợp còn
là giải pháp duy nhất Khi bạn làm nghiên cứu trên một mô hình thực nghiệm động vật nhưtrong thí dụ sau đây, test phi tham số hết sức hữu ích
Chúc các bạn thành công
2
Trang 3Quy ước trình bày
Trong tài liệu này chúng ta sẽ làm quen với 3 nhân vật
Bác sĩ Nguyễn Văn Thái
Bác sĩ Thái là một cao thủ thống kê y học trên giang hồ Anh ta sẽ xuất hiện trướcmọi vấn đề khó khăn, nhằm đưa ra câu trả lời chính xác và ôn lại cho bạn nhữngkiến thức cơ bản cũng như chuyên sâu về lý thuyết thống kê Tuy nhiên BS Thái lạirất bận rộn nên không đủ thời gian đi vào cách thực hiện chi tiết Anh ta cũng haytrình bày lý thuyết thuần túy và sử dụng nhiều công thức toán học nên không mấygần gũi với sinh viên và gây không ít trở ngại cho các bạn vốn dị ứng với thống kê
…
Bác sĩ Lê Ngọc Khả Nhi
Khả Nhi là một nữ bác sĩ trẻ dễ thương và sử dụng thành thạo SPSS Như tên
gọi của mình, BS Nhi có tính cách hồn nhiên và ngây thơ như trẻ con, vì vậy
cô ấy luôn có khuynh hướng đơn giản hóa tối đa mọi vấn đề Khả Nhi sẽ
hướng dẫn các bạn sử dụng SPSS qua từng bước cụ thể, chia sẻ những mẹo
vặt, thủ thuật để giúp các bạn đi đến kết quả nhanh và dễ dàng nhất
Sinh viên Trần Quốc Bảo
Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên cứu khoahọc Đây là một cậu sinh viên rất tò mò và luôn đặt ra nhiều câu hỏi liên quanđến thống kê Mặc dù những đế tài do Bảo thực hiện còn đơn giản, nhưngđồng hành với cậu ta, các bạn có cơ hội tích lũy cho mình nhiều kinh nghiệmtrong công việc phân tích số liệu và thiết kế nghiên cứu
3
Trang 41 2 3
(1) Phẫu thuật giả (2) (3): Viêm tụy cấp thực nghiệm
(+ Chế độ ăn với Oleuropein x 10 ngày)
Mức độ hoại tử mô tụyAmylase tụy
TNF-alphaIL-6
Y1
Y2
Y3
Y4 Một nhóm nghiên cứu sinh làm thí nghiệm sau để khảo sát tác dụng kháng
viêm của Oleuropein, một chất chiết xuất từ quả Olive trong bệnh lý viêmtụy cấp, dựa vào mô hình thực nghiệm trên chuột
Có 3 phân nhóm chuột (n=10 con cho mỗi nhóm) Nhóm 1 được áp dụngphẫu thuật giả, nhóm 2 được gây viêm tụy cấp thực nghiệm nhưng nhóm 3được cung cấp Oleuropein 20g/kg trong 10 ngày trước khi gây viêm tụycấp thực nghiệm
Sau khi phẫu thuật 24h, những thông số sau đây được khảo sát: Nồng độ một số chất thông tin gây phản ứngviêm: TNF-alpha, Interleukin 6, nồng độ Amylase tụy trong máu, và mức độ hoại tử mô tụy trên giải phẫubệnh Giả thuyết nghiên cứu đặt ra là: Liệu Oleuropein có làm giảm ý nghĩa hiện tượng viêm hệ thống và táchại cục bộ ở mô tụy hay không ? Phương pháp thống kê nào phù hợp nhất cho thiết kế này ?
Nghiên cứu này đòi hỏi phân tích phương sai để so sánh một đại lượng giữa
3 phân nhóm độc lập Tuy nhiên do cỡ mẫu thấp và có biến số thứ hạng, nên
dự tính sẽ không áp dụng được ANOVA Lúc này giải pháp thay thế là test phitham số Kruskal Wallis
1 1.1 Tình huống thí dụ
4
Trang 5Kiểm định Kruskal-Wallis được thiết lập năm 1952 bởi 2nhà thống kê người Mỹ William kruskal và Wilson Wallis,như một giải pháp phi tham số, thay thế cho phân tíchphương sai (ANOVA) Như mọi phương pháp phi tham sốkhác, test Kruskal Wallis dựa vào việc xếp thứ hạng chungcủa các cá thể để có phân phối chuẩn, sau đó tính trị sốthống kê H và kiểm tra giả thuyết 0 dựa vào phân phối χ2
Kruskal; Wallis (1952) "Use of ranks in one-criterion variance analysis" Journal of the American Statistical Association 47 (260): 583–621.
Hình vẽ sau đây nhằm minh họa một cách đơn giản cho nguyên tắc sosánh đặc tính phân phối giữa 3 phân nhóm A,B,C
Trong thí dụ này, 3 phân nhóm A,B,C có đặc tính phân phối đồng dạng,nhưng lệch nhau, và không chuẩn Khi gộp chung lại với nhau, ta có thểthấy khuynh hướng khác biệt giữa trung vị của A, B và C (Hình (a))Việc xếp hạng là 1 hình thức chuyển dạng biến số để khắc phục vi phạmgiả định phân phối chuẩn Sau khi xếp thứ hạng chung (không phân biệt
cá thể i thuộc về nhóm nào), ta sẽ có histogram thứ hạng, với phân phốichuẩn như hình (b) Lúc này những cá thể có thứ hạng thấp sẽ dồn hết
về bên trái, ngược lại những cá thể hạng cao sẽ dồn về bên phải TrongSPSS có thể thực hiện xếp hạng dễ dàng bằng lệnh Rank
Trang sau sẽ trình bày về công thức tính trị số H trong test Kruskal-Wallis
Lưu ý : Kiểm định Kruskal Wallis yêu cầu một số giả định như sauCác phân nhóm phải độc lập: Y được khảo sát 1 lần duy nhất trênnhững cá thể khác nhau (Kruskall Wallis không áp dụng được chothiết kế khảo sát lặp lại theo thời gian)
Kruskal Wallis có thể áp dụng cho Y là thứ hạng, nhưng không chấpnhận Y có ý nghĩa định tính rời rạc (ví dụ những phân loại bệnh lý khácnhau)
1 1.2 Test Kruskal Wallis
5
Trang 6Trị số H
Công thức tổng quát : H = (N − 1) i=1k ni ri− r2
i=1
k j=1
𝑛𝑖là số trường hợp trong phân nhóm i (cỡ mẫu của nhóm i)
𝑟𝑖𝑗 là thứ hạng của trường hợp j (sau khi xếp chung tất cả lại, không phân biệtphân nhóm) vốn thuộc về nhóm i
N là tổng số trường hợp ở tất cả phân nhóm, và k là số phân nhóm (hay bậc giá trịcủa
Nếu giả định không có trường hợp trùng hạng trong toàn bộ các phân nhóm, H cóthể ước tính theo cách đơn giản hơn:
Kiểm định Kruskal-Wallis dựa vào trị số H, có phân phối χ2 với độ tự do = (k-1)
Giả thuyết 0: Phân phối thứ hạng là như nhau trong mỗi phân nhóm
Giả thuyết thay thế: Có sự khác biệt về đặc tính phân phối (của thứ hạng) giữa các phân nhóm
Nếu các phân nhóm có phân phối đồng dạng, ta có thể so sánh trung vị với giả thuyết: Có sự khác biệt
về trung vị giữa các phân nhóm
Ghi chú:
+ Test Kruskal Wallis được xem như phân tích phương sai, mặc dù nó không bắt buộc thứ hạng phảiphân phối chuẩn, nhưng nó vẫn đòi hỏi giả định phương sai đồng nhất (của thứ hạng) Cách kiểm tragiả định này là dùng lệnh Rank để xếp thứ hạng trong SPSS, sau đó dùng lệnh Explore với test Levene.+ Sau khi xếp thứ hạng, bạn vẫn có thể làm ANOVA trên chính giá trị thứ hạng này Cách làm này sẽ cho
ra kết quả tương đương với test Kruskal Wallis
1 1.2 Test Kruskal Wallis
6
Trang 7Loại biến số
Định lượngliên tục
Không liên tục(Thứ hạng)
Không ANOVA đơn biến
So sánh 1 đại lượng giữa ≥ 3 phân nhóm
Kruskal-Wallis Xếp thứ hạng
1 1.3 Test Kruskal Wallis (không chỉ) là một giải pháp thay thế cho ANOVA đơn biến
Ứng dụng của kiểm định H theo Kruskal-Wallis
1 Thay thế cho phân tích phương sai 1 yếu tố (ANOVA đơn biến) trong trường hợp : cỡ mẫu quá thấp, có viphạm các giả định về phân phối chuẩn và/hoặc có những điểm giá trị cá biệt Bản thân Kruskall Wallis đượcxem như 1 hình thức phân tích phương sai (ANOVA), cho phép so sánh đặc tính phân phối (hoặc trung vị) của Ygiữa nhiều (≥3) phân nhóm độc lập
2 Bắt buộc sử dụng test Kruskal Wallis khi đại lượng cần so sánh là một biến số không liên tục (thứ hạng, thangđiểm, giả định lượng)
Thí dụ:
Những nghiên cứu thuộc chuyên khoa chẩn đoán hình ảnh, giải phẫu bệnh lý thường dùng nhiều biến thứ hạng.Các nghiên cứu dùng thang điểm, bảng câu hỏi… (ví dụ thăm dò chức năng giấc ngủ, mức độ đau, chất lượng cuộcsống…)
Những mô hình thí nghiệm trên động vật, tế bào, mô Các thí nghiệm Western-Blot, hóa mô miễn dịch (do cỡ mẫuquá nhỏ, và/hoặc giá trị không liên tục)
F Biến số F, thuộc loại định tính (≥ 3 giá trị) dùng để phân nhóm
Y Biến số Y, giá trị của đại lượng cần so sánh Y có thể là
biến định lượng liên tục, hoặc giả định lượng (thứhạng)
Y
7
Trang 8Ghi chú:
+ Sau khi xếp hạng, phân phối của Y xem như được chuẩn hóa, bạn vẫn có thế sử dụng ANOVA đơn biến nếuthích, tuy không chính xác bằng mô hình theo thang đo định lượng liên tục Ngược lại, test Kruskal Wallis vẫn cầngiả định về đồng nhất phương sai
+ Ngay cả khi số liệu phân phối chuẩn, không có điểm cá biệt, bạn vẫn có thể dùng test Kruskal-Wallis, lúc này nóđược xem như 1 phương pháp độc lập, không chỉ thay thế cho ANOVA Bản thân test Kruskal-Wallis dựa trên giảthuyết 0 về đặc tính phân phối, nên cho ra kết luận phổ quát hơn mô hình ANOVA chỉ cho phép chứng minh hiệuứng ý nghĩa của yếu tố F lên giá trị trung bình của Y Trong trường hợp ANOVA cho ra kết quả không rõ nét, bạn
có thể cân nhắc dùng test Kruskal Wallis với hy vọng tìm ra sự khác biệt (vì ít bảo thủ hơn)
+Ý nghĩa của 2 quy trình hoàn toàn khác nhau, nên cách diễn giải sẽ khác nhau ANOVA dựa vào mô hình hồi quytuyến tính và so sánh nhiều giá trị trung bình; test Kruskal Wallis dựa vào thứ hạng và so sánh đặc tính phân phối(hay trung vị)
Một khi đã dùng test Mann-Whitney bạn cần phải mô tả đặc tính phân phối của 2 phân nhóm (Trung vị,Skewness, Kurtosis, bách phân vị, tứ phân vị…) thay vì dùng trung bình và độ lệch chuẩn, sai số chuẩn nhưthường lệ
1 1.3 Test Kruskal Wallis (không chỉ) là một giải pháp thay thế cho ANOVA đơn biến
8
Trang 9Khảo sát đặc tính phân phối của Y ở mỗi phân
nhóm
Tính các giá trị: Trung vị, Skewness, KurtosisKiểm tra giả định phân phối chuẩn của Y ở mỗiphân nhóm, phát hiện điểm giá trị cá biệt
Vẽ biểu đồ histogram cho mỗi phân nhóm
So sánh đặc tính phân phối giữa chúng
Giả thuyết 0 được phát biểu tùy theo tínhđồng dạng hay không giữa 2 phân phối…
Xếp hạng, tính trị số H, kiểm tra giả thuyết 0
Phân tích sâu: Test post-hoc
Nếu p<0,05; ta cần thực hiện so sánh bắt cặptuần tự giữa các phân nhóm Có nhiều phươngpháp để làm việc này:
+ Đơn giản nhất (nhưng cũng yếu nhất) là làmMann-Whitney tuần tự cho từng cặp phânnhóm
+ Kinh điển: Kiểm định Dunn (1964) – SPSS sửdụng quy trình này
+ Hiện đại: Dwass-Steel-Critchlow-Fligner hoặcConover-Inman (1991) (không được hỗ trợtrong SPSS)
SPSS cho phép thực hiện test kruskal Wallis theo 2 quy trình:
Những phiên bản cũ (17 trở về trước) áp dụng quy trình cũ, bạn phải tự xác định loại test cần sửdụng, sau đó thiết lập một số tùy chỉnh thống kê Kết quả được xuất thẳng ra dưới dạng bảng Tuynhiên quy trình cũ có nhiều nhược điểm, ví dụ không làm được test Post-hoc, thay vào đó bạn phảilàm thủ công test Mann-Whitney hàng loạt để so sánh bắt cặp 2 phân nhóm
Quy trình mới có nhiều ưu điểm hơn: Tự động xác định loại test phi tham số phù hợp với số liệu bạnđưa vào, phần kết quả chi tiết hơn, bao gồm biểu đồ Box-plot, test post-hoc theo Dunn (1964) hoặctest tương phản phân nhóm (Step-wise)
Chú ý:
+ Test Kruskal Wallis không cho phép tính hệ số ảnh hưởng (effect size) r trực tiếp, tuy nhiên có thểtính được r thông qua Z của test Mann-Whitney hay Dunn, theo công thức:
𝑟 = 𝑍/ 𝑁+ Thực ra phương pháp Dunn chưa phải là cách tối ưu để thực hiện post-hoc test, còn 2 phương pháphiện đại hơn là Dwass-Steel-Critchlow-Fligner và Conover-Inman, rất tiếc là SPSS không hỗ trợ 2phương pháp này Hiện nay chỉ có R và XLSTAT cho phép thực hiện 2 test này
2 2.1 Quy trình làm test Kruskal Wallis trong SPSS
Dunn, O J (1964) Multiple comparisons using rank sums Technometrics, 6, 241-252. 9
Trang 10Click chuột trái 2 lần vào icon
của file syntax, cửa sổ Syntax
Để thực hiện riêng 1 khối lệnh bất kì:
1° Đánh dấu chọn nội dung khối lệnh cần thihành
2° Nhấp chuột phải để mở Menu, chọn RunSelection
Trong thí dụ này, trước hết chúng ta tạo 1 data base gồm 5 biến số
như trong hình vẽ: Biến Y1,Y2,Y3,Y4 lần lượt chỉ 4 đại lượng cần khảo
sát là : Amylase tụy, IL-6, mức độ hoại tử mô, TNF-alpha Chú ý: Mặc
dù Y3 là biến thứ hạng nhưng ta vẫn đặt Measure = Scale, vì nếu
không SPSS không thể so sánh được
Biến F= Phân nhóm , thuộc loại định tính, nhiều giá trị (Nominal),
nhận 3 giá trị: 1=Nhóm 1, 2=Nhóm 2, 3=Nhóm 3
Sau khi nhập số liệu, bạn tải file Syntax về máy và mở nó lên:
2 2.2 Tạo bảng số liệu và sử dụng syntax
10
Trang 11*Bước 1A: Thăm dò số liệu
*Bước 1B: Thăm dò sau khi xếp hạng
RANK VARIABLES=Y1 Y2 Y3 Y4 (A)
/RANK
/PRINT=YES
/TIES=MEAN.
EXAMINEVARIABLES= RY1 RY2 RY3 RY4 BY F
/PLOT BOXPLOT NPPLOT SPREADLEVEL(1)
DELETE VARIABLES RY1 RY2 RY3 RY4
Khối lệnh bước 1A có nội dung thăm dò số liệu, baogồm:
Bảng thống kê mô tả, tính giá trị trung vị, skewness,kurtosis (Xem tài liệu về test Mann Whitney để rõcông dụng những trị số này)
Đồng thời làm test Shapiro-Wilk để kiểm tra giả địnhphân phối chuẩn
Và vẽ Box-plot để phát hiện giá trị ngoại lai
Ghi chú: Box-plot có thể dùng để báo cáo kết quả nếu
Y là biến liên tục Một dạng biểu đồ khác phổ quát vàchính xác hơn là scatter dot, sẽ được vẽ trong bước1C
Cuối cùng là test evene để kiểm tra giả định vềphương sai đồng nhất
Khối lệnh bước 1B chỉ nhằm mục đích minh họa cho ýtưởng: Sau khi xếp thứ hạng xong, những biến số cóphân phối không bình thường (như kết quả testShapiro-Wilk bước 1A cho thấy ) sẽ được chuẩn hóa,
và có phân phối (thứ hạng) bình thường
Bước 1B còn dùng để kiểm tra giả định về đồng nhấtphương sai bằng test Levene, là điều kiện cho phép sosánh trung vị bằng Kruskal Wallis, và làm ANOVA đơnbiến trên biến số sau khi xếp hạng
2 2.3 Nội dung syntax
11
Trang 12*Bước 1C: Vẽ biểu đồ so sánh giữa các phân nhóm cho Y1
DATA: F =col(source(s), name(" F "), unit.category())
DATA: Y1 =col(source(s), name(" Y1 "))
GUIDE: axis(dim(1), label(" Phân nhóm "))
GUIDE: axis(dim(2), label(" Amylase tụy (IU/L) "))
SCALE: linear(dim(2), include(0))
ELEMENT: point(position( F*Y1 ))
DATA: F=col(source(s), name("F"), unit.category())
DATA: Y3=col(source(s), name("Y3"))
GUIDE: axis(dim(1), label("Phân nhóm"))
GUIDE: axis(dim(2), label("Mức độ hoại tử mô/GPB"))
SCALE: cat(dim(1), include("1", "2", "3"))
SCALE: linear(dim(2), include(0))
ELEMENT: point(position(F*Y3))
END GPL
Nội dung khối lệnh bước 1C là để vẽ biểu đồscatter dots plot cho phép so sánh trực quan phânphối giá trị Y giữa các phân nhóm Trục hoành chỉphân nhóm (F), mỗi cá thể là 1 điểm giá trị.Cách làm này chính xác hơn biểu đồ Box-Plots màSPSS cung cấp kèm theo test Kruskal Wallis.Chú ý: Thay đổi tên biến Y và nội dung trục tung,trục hoành cho phù hợp với nghiên cứu của bạn
Nếu Y là 1 biến thứ hạng (không liên tục), bạn nhớthêm dòng lệnhSCALE: cat(…)
2 2.3 Nội dung syntax
12
Trang 13*Bước 2A: Kruskal-Wallis theo quy trình mới
với so sánh bắt cặp hàng loạt theo phương pháp Dunn
/CRITERIA ALPHA=0.05 CILEVEL=95.
*Bước 2B: Kruskal Wallis theo quy trình cũ,
với Post hoc test sử dụng Mann-Whitney hàng loạt
*Bước 2C: Kruskal-Wallis theo quy trình mới,
bao gồm test tương phản
NPTESTS
/INDEPENDENT TEST (Y1 Y2 Y3 Y4) GROUP (F)
KRUSKAL_WALLIS(COMPARE=STEPWISE)
/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95
*Bước 3: ANOVA đơn biến cho thứ hạng
RANKVARIABLES= Y1 Y2 Y3 Y4 (A)
/RANK
/PRINT=YES
/TIES=MEAN.
ONEWAY RY1 RY2 RY3 RY4 BY F
/STATISTICS EFFECTS HOMOGENEITY
/MISSING ANALYSIS
/POSTHOC=BONFERRONI GH ALPHA(0.05).
DELETE VARIABLES RY1 RY2 RY3 RY4
Test kruskal Wallis có thể thực hiện theo quy trình mới
và cũ Quy trình mới có nhiều ưu điểm hơn, vì tự độnglựa chọn loại test phi tham số phù hợp với thiết kế biến
số (Ví dụ khi F có 2 giá trị, SPSS sẽ chọn test Mann Whitney, F có 3 giá trị, SPSS sẽ làm test Kruskal Wallis Hơn nữa, quy trình mới cho phép làm post hoc test (không được hỗ trợ trong quy trình cũ)
Khối lệnh 2A có nội dung: Làm test Kruskal Wallis và post hoc test theo Dunn (1964)
Khối lệnh 2B có nội dung thực hiện test Kruskal Wallistheo quy trình cũ, sau đó làm test Mann-Whitney hàngloạt để so sánh bắt cặp tuần tự giữa các phân nhóm: F=1
vs F=2, F=1 vs F=3 và F=2 vs F=3
Nhược điểm duy nhất là cách làm này không cho phéphiệu chỉnh theo Bonferonni, nên chỉ thích hợp cho K=3.Nếu bạn có từ 4 phân nhóm trở lên, nên sử dụng quytrình mới
Khối lệnh 2B có nội dung thực hiện test Kruskal Wallistheo quy trình mới, nhưng thay vì làm test Post-hoc thì sẽphân tích tương phản để phân lớp giá trị cho các phânnhóm Cách làm này cho phép nhận diện nhanh sự tươngphản khi có nhiều nhóm, nhưng không phải lúc nào cũngtính ra được giá trị p, nên bất tiện hơn so với PP Dunn
Khối lệnh bước 3 chỉ nhằm mục đích minh họa cho ýtưởng: Có thể làm ANOVA đơn biến cho số liệu đã xếphạng Thông thường kết quả sẽ như nhau so với KruskalWallis Nhưng cách làm này không chính thống và có thểgây hiểu nhầm nếu diễn giải không đúng
Ghi chú: Trong thực tế bạn chỉ cần làm duy nhất bước 2A Những bước còn lại chỉ có ý nghĩa minh họa.Lưu ý thay đổi nội dung màu đỏ trong các dòng lệnh để phù hợp với nghiên cứu của bạn Với:
Y1,Y2,Y3,Y4 là tên các biến cần so sánh, F là biến số phân nhóm
Nếu nghiên cứu của bạn có ít biến số hơn, hãy xóa bớt Y, nếu nhiều hơn, bạn có thể thêm tuần tự Y5,Y6…
Nếu bạn có nhiều phân nhóm (ví dụ 4,5), thay đổi các dòng lệnh liên quan tới F trong bước 2B
Nói chung chỉ có khối lệnh 2B là hơi phức tạp, còn lại đều đơn giản
2 2.3 Nội dung syntax
13
Trang 143 3 Diễn giải kết quả 3.1 Kiểm tra giả định phân phối bình thường
Tests of Normality
Phân nhóm Kolmogorov-Smirnov a Shapiro-Wilk
Statistic df Sig Statistic df Sig.
Amylase tụy (IU/L)
* This is a lower bound of the true significance.
a Lilliefors Significance Correction
Thông thường khi so sánh giữa nhiều phân nhóm, chúng ta sẽ kiểm tra 2 giả định về phân phốichuẩn, giá trị cá biệt Nếu chúng được thỏa mãn, bạn có thể làm ANOVA Nhưng nếu có sự viphạm, vấn đề sẽ khó khăn hơn một chút, có thể bạn phải chuyển dạng biến số với hy vọng sẽ cóphân phối chuẩn Test phi tham số là giải pháp cuối cùng khi tất cả hình thức chuyển dạng đãthất bại
Do đó, trong tài liệu này chúng ta cũng đi tuần tự theo các bước, bắt đầu bằng kiểm tra số liệu.Nếu bạn thực hiện thăm dò với khối lệnh bước 1, bạn sẽ thấy bảng kết quả test Shapiro-Wilk,chỉ cần đọc giá trị p ở cột cuối cùng Giá trị trông đợi là p>0,05 (có phân phối bình thường).Ngược lại p<0,05 tức là phân phối không bình thường
Chú ý: Nếu cỡ mẫu đủ lớn (>50) bạn có thể dùng Q-Q plot một cách trực quan để kết luận vềphân phối chuẩn (xem thêm các tài liệu về ANOVA)
Trong trường hợp này, có 2 biến số vi phạm giả định về phân phối chuẩn: Amylase tụy (Y1) vàMức độ hoại tử (Y3) Trong đó Y3 là biến thứ hạng nên vi phạm không nằm ngoài dự tính Dùsao với biến thứ hạng thì hiếm khi có thể dùng ANOVA, test Kruskal Wallis là giải pháp tối ưucho loại biến này
Với 2 biến Y2 (IL-6) và TNF-alpha (Y4): Chúng thỏa giả định phân phối bình thường, nên bạn cóquyền dùng ANOVA để phân tích cho 2 biến này Tuy nhiên trong tài liệu này tác giả áp dụngKruskal Wallis cho toàn bộ 4 biến số, trước hết bởi vì cỡ mẫu ở đây quá nhỏ (n=10) nên testShapiro-Wilk không đáng tin cậy, thứ hai là để minh họa cho ý tưởng : Không nên xem thườnghay né tránh test phi tham số và chỉ dùng nó như giải pháp thay thế, thực ra bạn hoàn toàn cóthể dùng nó bất cứ khi nào bạn thích Test Kruskal Wallis không chỉ là một giải pháp thay thế, nó
là chính nó và hoàn toàn có thể đứng độc lập 1 mình trong mọi trường hợp
14