Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 29 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
29
Dung lượng
2,24 MB
Nội dung
Tài liệu hướng dẫn thống kê y học sử dụng SPSS Kiểm định Kruskal-Wallis Lê Đông Nhật Nam Lời nói đầu Mỗi nói test phi tham số, lại nhớ câu chuyện người bạn học chung lớp năm lớp 12 Đó cô gái tài đặc biệt Cô gần lệch khỏi quỹ đạo chương trình phổ thông, bị điểm cho tất môn khoa học tự nhiên Toán, Lý, Hóa, Sinh… Nhiều lần cô ta trở thành trò cười cho lớp phát biểu sai lầm ngây thơ lỗi Cô giống hình ảnh vịt xấu xí bên cạnh người bạn học sinh giỏi khác Thời gian trôi qua, thấm thoát tới hè mải mê chạy theo kì thi tuyển sinh đại học Sau mùa thi năm đó, hỏi thăm tin tức nhận thực trái ngược hoàn toàn với thầy cô lớp dự đoán Nhiều học sinh giỏi lớp trượt đại học thi vào trường danh Bách Khoa, Y dược; số khác đậu vào nguyện vọng không ý, cô bạn mà ngày xem thường lại đỗ trường đại học dân lập, không danh giá, hoàn toàn phù hợp với môn xã hội ngoại ngữ, Văn, sở trường cô ta Hơn nữa, thời gian sau cô tham gia câu lạc thời trang trở thành khuôn mặt người mẫu tiếng báo chí, chí tham gia làm MC kiện thể thao, văn nghệ giới trẻ Trong nhiều cô bạn giỏi Toán, Lý, Hóa sau năm đại học lại làm công việc văn phòng bình thường, gần vô danh xã hội Có vẻ vịt ta tưởng xấu xí, đơn giản không vào giới nó, sống môi trường thích hợp hóa thành thiên nga xinh đẹp Những test phi tham số Bên cạnh phương pháp thông dụng ANOVA, mô hình hồi quy, test t,… test phi tham số phải chịu định kiến hắt hủi cách phi lý Nhiều người cho chúng yếu hơn, nguy sai lầm, đơn giản là… họ không thích, , né tránh sử dụng, buộc phải dùng đến không giải pháp khác Bộ tài liệu nhằm chuyển đến bạn thông điệp giản dị, phương pháp dở xấu, loại có chỗ đứng độc lập Ví dụ test Kruskal Wallis không giải pháp thay cho ANOVA, nó nhiều trường hợp giải pháp Khi bạn làm nghiên cứu mô hình thực nghiệm động vật thí dụ sau đây, test phi tham số hữu ích Chúc bạn thành công Quy ước trình bày Trong tài liệu làm quen với nhân vật Bác sĩ Nguyễn Văn Thái Bác sĩ Thái cao thủ thống kê y học giang hồ Anh ta xuất trước vấn đề khó khăn, nhằm đưa câu trả lời xác ôn lại cho bạn kiến thức chuyên sâu lý thuyết thống kê Tuy nhiên BS Thái lại bận rộn nên không đủ thời gian vào cách thực chi tiết Anh ta hay trình bày lý thuyết túy sử dụng nhiều công thức toán học nên không gần gũi với sinh viên gây không trở ngại cho bạn vốn dị ứng với thống kê … Bác sĩ Lê Ngọc Khả Nhi Khả Nhi nữ bác sĩ trẻ dễ thương sử dụng thành thạo SPSS Như tên gọi mình, BS Nhi có tính cách hồn nhiên ngây thơ trẻ con, cô có khuynh hướng đơn giản hóa tối đa vấn đề Khả Nhi hướng dẫn bạn sử dụng SPSS qua bước cụ thể, chia sẻ mẹo vặt, thủ thuật để giúp bạn đến kết nhanh dễ dàng Sinh viên Trần Quốc Bảo Bảo sinh viên y khoa năm thứ sáu bắt đầu làm quen với nghiên cứu khoa học Đây cậu sinh viên tò mò đặt nhiều câu hỏi liên quan đến thống kê Mặc dù đế tài Bảo thực đơn giản, đồng hành với cậu ta, bạn có hội tích lũy cho nhiều kinh nghiệm công việc phân tích số liệu thiết kế nghiên cứu 1.1 Tình thí dụ Chứng âm Chứng dương (1) Phẫu thuật giả Lấy mẫu máu Y1 Amylase tụy Y4 TNF-alpha Y2 IL-6 Nhóm khảo sát (+ Chế độ ăn với Oleuropein x 10 ngày) (2) (3): Viêm tụy cấp thực nghiệm Nghiên cứu giải phẫu bệnh học Y3 Mức độ hoại tử mô tụy Một nhóm nghiên cứu sinh làm thí nghiệm sau để khảo sát tác dụng kháng viêm Oleuropein, chất chiết xuất từ Olive bệnh lý viêm tụy cấp, dựa vào mô hình thực nghiệm chuột Có phân nhóm chuột (n=10 cho nhóm) Nhóm áp dụng phẫu thuật giả, nhóm gây viêm tụy cấp thực nghiệm nhóm cung cấp Oleuropein 20g/kg 10 ngày trước gây viêm tụy cấp thực nghiệm Sau phẫu thuật 24h, thông số sau khảo sát: Nồng độ số chất thông tin gây phản ứng viêm: TNF-alpha, Interleukin 6, nồng độ Amylase tụy máu, mức độ hoại tử mô tụy giải phẫu bệnh Giả thuyết nghiên cứu đặt là: Liệu Oleuropein có làm giảm ý nghĩa tượng viêm hệ thống tác hại cục mô tụy hay không ? Phương pháp thống kê phù hợp cho thiết kế ? Nghiên cứu đòi hỏi phân tích phương sai để so sánh đại lượng phân nhóm độc lập Tuy nhiên cỡ mẫu thấp có biến số thứ hạng, nên dự tính không áp dụng ANOVA Lúc giải pháp thay test phi tham số Kruskal Wallis 1.2 Test Kruskal Wallis K William Kruskal (19192005) Nhà toán học người Mỹ Kiểm định Kruskal-Wallis thiết lập năm 1952 nhà thống kê người Mỹ William kruskal Wilson Wallis, giải pháp phi tham số, thay cho phân tích phương sai (ANOVA) Như phương pháp phi tham số khác, test Kruskal Wallis dựa vào việc xếp thứ hạng chung cá thể để có phân phối chuẩn, sau tính trị số thống kê H kiểm tra giả thuyết dựa vào phân phối χ2 W Wilson Allen Wallis (1912-1998) Chuyên gia kinh tế, thống kê người Mỹ Kruskal; Wallis (1952) "Use of ranks in one-criterion variance analysis" Journal of the American Statistical Association 47 (260): 583–621 Hình vẽ sau nhằm minh họa cách đơn giản cho nguyên tắc so sánh đặc tính phân phối phân nhóm A,B,C Trong thí dụ này, phân nhóm A,B,C có đặc tính phân phối đồng dạng, lệch nhau, không chuẩn Khi gộp chung lại với nhau, ta thấy khuynh hướng khác biệt trung vị A, B C (Hình (a)) Việc xếp hạng hình thức chuyển dạng biến số để khắc phục vi phạm giả định phân phối chuẩn Sau xếp thứ hạng chung (không phân biệt cá thể i thuộc nhóm nào), ta có histogram thứ hạng, với phân phối chuẩn hình (b) Lúc cá thể có thứ hạng thấp dồn hết bên trái, ngược lại cá thể hạng cao dồn bên phải Trong SPSS thực xếp hạng dễ dàng lệnh Rank Lưu ý : Kiểm định Kruskal Wallis yêu cầu số giả định sau Các phân nhóm phải độc lập: Y khảo sát lần cá thể khác (Kruskall Wallis không áp dụng cho thiết kế khảo sát lặp lại theo thời gian) Kruskal Wallis áp dụng cho Y thứ hạng, không chấp nhận Y có ý nghĩa định tính rời rạc (ví dụ phân loại bệnh lý khác nhau) (a) (b) Trang sau trình bày công thức tính trị số H test Kruskal-Wallis 1.2 Test Kruskal Wallis Công thức tổng quát : H = (N − 1) r= Trị số H H ni j=1 rij ri = Với k i=1 ni ri −r ni k i=1 j=1 rij −r ni N + trung bình tất thứ hạng rij 𝑛𝑖 số trường hợp phân nhóm i (cỡ mẫu nhóm i) 𝑟𝑖𝑗 thứ hạng trường hợp j (sau xếp chung tất lại, không phân biệt phân nhóm) vốn thuộc nhóm i N tổng số trường hợp tất phân nhóm, k số phân nhóm (hay bậc giá trị Nếu giả định trường hợp trùng hạng toàn phân nhóm, H ước tính theo cách đơn giản hơn: 12 H= N(N + 1) 12 H= N(N + 1) k ni ri − i=1 N+1 2 k ni ri − 3(N + 1) i=1 Nếu có trường hợp trùng hạng, H tính công thức đơn giản cần phải hiệu chỉnh cách chia cho hệ số hiệu chỉnh T: Hc = H/T Với T=1 − T=1 − 𝐺 𝑖=1 𝑡𝑖 (𝑡𝑖 −1) 𝑁(𝑁2 −1) 𝐺 𝑖=1(𝑡𝑖 −𝑡𝑖 ) (𝑁 −𝑁) Kiểm định Kruskal-Wallis dựa vào trị số H, có phân phối χ2 với độ tự = (k-1) Giả thuyết 0: Phân phối thứ hạng phân nhóm Giả thuyết thay thế: Có khác biệt đặc tính phân phối (của thứ hạng) phân nhóm Nếu phân nhóm có phân phối đồng dạng, ta so sánh trung vị với giả thuyết: Có khác biệt trung vị phân nhóm Ghi chú: + Test Kruskal Wallis xem phân tích phương sai, không bắt buộc thứ hạng phải phân phối chuẩn, đòi hỏi giả định phương sai đồng (của thứ hạng) Cách kiểm tra giả định dùng lệnh Rank để xếp thứ hạng SPSS, sau dùng lệnh Explore với test Levene + Sau xếp thứ hạng, bạn làm ANOVA giá trị thứ hạng Cách làm cho kết tương đương với test Kruskal Wallis 1.3 Test Kruskal Wallis (không chỉ) giải pháp thay cho ANOVA đơn biến So sánh đại lượng ≥ phân nhóm Loại biến số Không liên tục (Thứ hạng) Định lượng liên tục Đặc tính phân phối Phân phối không chuẩn Xếp thứ hạng Kruskal-Wallis Giá trị cá biệt Có Không ANOVA đơn biến Ứng dụng kiểm định H theo Kruskal-Wallis Thay cho phân tích phương sai yếu tố (ANOVA đơn biến) trường hợp : cỡ mẫu thấp, có vi phạm giả định phân phối chuẩn và/hoặc có điểm giá trị cá biệt Bản thân Kruskall Wallis xem hình thức phân tích phương sai (ANOVA), cho phép so sánh đặc tính phân phối (hoặc trung vị) Y nhiều (≥3) phân nhóm độc lập Bắt buộc sử dụng test Kruskal Wallis đại lượng cần so sánh biến số không liên tục (thứ hạng, thang điểm, giả định lượng) Thí dụ: Những nghiên cứu thuộc chuyên khoa chẩn đoán hình ảnh, giải phẫu bệnh lý thường dùng nhiều biến thứ hạng Các nghiên cứu dùng thang điểm, bảng câu hỏi… (ví dụ thăm dò chức giấc ngủ, mức độ đau, chất lượng sống…) Những mô hình thí nghiệm động vật, tế bào, mô Các thí nghiệm Western-Blot, hóa mô miễn dịch (do cỡ mẫu nhỏ, và/hoặc giá trị không liên tục) F Y Biến số F, thuộc loại định tính (≥ giá trị) dùng để phân nhóm Y Biến số Y, giá trị đại lượng cần so sánh Y biến định lượng liên tục, giả định lượng (thứ hạng) 1.3 Test Kruskal Wallis (không chỉ) giải pháp thay cho ANOVA đơn biến Ghi chú: + Sau xếp hạng, phân phối Y xem chuẩn hóa, bạn sử dụng ANOVA đơn biến thích, không xác mô hình theo thang đo định lượng liên tục Ngược lại, test Kruskal Wallis cần giả định đồng phương sai + Ngay số liệu phân phối chuẩn, điểm cá biệt, bạn dùng test Kruskal-Wallis, lúc xem phương pháp độc lập, không thay cho ANOVA Bản thân test Kruskal-Wallis dựa giả thuyết đặc tính phân phối, nên cho kết luận phổ quát mô hình ANOVA cho phép chứng minh hiệu ứng ý nghĩa yếu tố F lên giá trị trung bình Y Trong trường hợp ANOVA cho kết không rõ nét, bạn cân nhắc dùng test Kruskal Wallis với hy vọng tìm khác biệt (vì bảo thủ hơn) +Ý nghĩa quy trình hoàn toàn khác nhau, nên cách diễn giải khác ANOVA dựa vào mô hình hồi quy tuyến tính so sánh nhiều giá trị trung bình; test Kruskal Wallis dựa vào thứ hạng so sánh đặc tính phân phối (hay trung vị) Một dùng test Mann-Whitney bạn cần phải mô tả đặc tính phân phối phân nhóm (Trung vị, Skewness, Kurtosis, bách phân vị, tứ phân vị…) thay dùng trung bình độ lệch chuẩn, sai số chuẩn thường lệ 2.1 Quy trình làm test Kruskal Wallis SPSS Tính giá trị: Trung vị, Skewness, Kurtosis Kiểm tra giả định phân phối chuẩn Y phân nhóm, phát điểm giá trị cá biệt Khảo sát đặc tính phân phối Y phân nhóm Khảo sát trực quan tính đồng dạng phân phối Vẽ biểu đồ histogram cho phân nhóm So sánh đặc tính phân phối chúng Giả thuyết phát biểu tùy theo tính đồng dạng hay không phân phối… Đặt giả thuyết Thực kiểm định H theo KruskalWallis Xếp hạng, tính trị số H, kiểm tra giả thuyết Nếu p0,05) không giá trị cá biệt Vì lý bạn hoàn toàn làm ANOVA số liệu thứ hạng này, quan tâm đến khuynh hướng khác biệt (cách làm làm ý nghĩa mô hình định lượng liên tục, mở rộng thành GLM ANOVA cho thang đo liên tục) Tuy nhiên biến Y3 không thỏa giả định, biến thứ hạng không liên tục, giá trị phân tán Sau xếp thứ hạng, ta kiểm tra lại giả định phương sai đồng test Levene ANOVA Kết cho thấy tất biến số thỏa giả định này, dấu hiệu tốt, bạn làm test phi tham số 16 3 Diễn giải kết 3.4 Kết Kruskal Wallis theo quy trình Thứ tự biến số Y Loại test phi tham số Kết luận Nội dung giả thuyết Giá trị p Khi thực theo quy trình mới, kết test Kruskal Wallis xuất Lưu ý bảng tóm tắt, bạn click chuột vào bảng này, cửa sổ phụ mở với nhiều thông tin chi tiết hơn… 17 3 Diễn giải kết 3.4 Kết Kruskal Wallis theo quy trình Biểu đồ Box-plot so sánh phân nhóm Chú ý: Biểu đồ có ý nghĩa Y biến định lượng liên tục Không nên áp dụng cho biến số thứ hạng Một hình thức khác xác biểu đồ tập hợp điểm, hỗ trợ syntax Trị số χ2 hay H test Kruskal Wallis Độ tự = k-1 Giá trị p Kết thống kê test Kruskal Wallis báo cáo sau: [Phát biểu khác biệt ý nghĩa] (χ2(độ tự do)= H; giá trị p) Diễn giải kết quả: Có khác biệt ý nghĩa đặc tính phân phối nồng độ Amylase tụy nhóm : Phẫu thuật giả, viêm tụy cấp thực nghiệm có không dùng Oleuropein (χ2(2)= 19,365; p[...]... (Y1 Y2 Y3 Y4 ) GROUP (F) /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE /CRITERIA ALPHA=0.05 CILEVEL=95 *Bước 2B: Kruskal Wallis theo quy trình cũ, với Post hoc test sử dụng Mann-Whitney hàng loạt NPAR TESTS /K-W =Y1 Y2 Y3 Y4 BY F(1 3) /M-W= Y1 Y2 Y3 Y4 BY F(1 2) /M-W= Y1 Y2 Y3 Y4 BY F(1 3) /M-W= Y1 Y2 Y3 Y4 BY F(2 3) /STATISTICS DESCRIPTIVES QUARTILES /MISSING ANALYSIS *Bước 2C: Kruskal- Wallis theo quy... /INDEPENDENT TEST (Y1 Y2 Y3 Y4 ) GROUP (F) KRUSKAL_ WALLIS( COMPARE=STEPWISE) /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE /CRITERIA ALPHA=0.05 CILEVEL=95 *Bước 3: ANOVA đơn biến cho thứ hạng RANK VARIABLES =Y1 Y2 Y3 Y4 (A) /RANK /PRINT=YES /TIES=MEAN ONEWAY RY1 RY2 RY3 RY4 BY F /STATISTICS EFFECTS HOMOGENEITY /MISSING ANALYSIS /POSTHOC=BONFERRONI GH ALPHA(0.05) DELETE VARIABLES RY1 RY2 RY3 RY4 Test kruskal Wallis. .. định về phân phối chuẩn: Amylase t y (Y1 ) và Mức độ hoại tử (Y3 ) Trong đó Y3 là biến thứ hạng nên vi phạm không nằm ngoài dự tính Dù sao với biến thứ hạng thì hiếm khi có thể dùng ANOVA, test Kruskal Wallis là giải pháp tối ưu cho loại biến n y Với 2 biến Y2 (IL-6) và TNF-alpha (Y4 ): Chúng thỏa giả định phân phối bình thường, nên bạn có quyền dùng ANOVA để phân tích cho 2 biến n y Tuy nhiên trong tài. .. văn bản khoa học Phương pháp thống kê Dữ liệu được phân tích bằng gói phần mềm IBM-SPSS 20 Test Kruskal- Wallis và test so sánh Dunn (1964) được sử dụng để so sánh đặc tính phân phối của các biến số giữa 3 phân nhóm Ngưỡng ý nghĩa thống kê được qui định =0,05 Kết quả 1) Men Amylase t y: Có sự khác biệt ý nghĩa về đặc tính phân phối của nồng độ Amylase t y giữa 3 nhóm : Phẫu thuật giả, viêm t y cấp thực... H, độ tự do, giá trị p Tuy nhiên quy trình cũ không có những thông tin về giả thuyết 0 cũng như quyết định sau cùng, cũng không kèm hình vẽ như quy trình mới 26 3 Diễn giải kết quả 3.5 Kết quả Kruskal Wallis theo quy trình cũ 3 Đ y là thí dụ minh họa cho kết quả post-hoc test theo quy trình cũ Thực chất ta đang làm MannWhitney test cho từng cặp phân nhóm Ranks 1 2 Amylase t y (IU/L) IL-6 (pg/ml) Mức... tra giả định về phương sai đồng nhất *Bước 1B: Thăm dò sau khi xếp hạng RANK VARIABLES =Y1 Y2 Y3 Y4 (A) /RANK /PRINT=YES /TIES=MEAN EXAMINE VARIABLES=RY1 RY2 RY3 RY4 BY F /PLOT BOXPLOT NPPLOT SPREADLEVEL(1) /COMPARE GROUPS /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING PAIRWISE /NOTOTAL DELETE VARIABLES RY1 RY2 RY3 RY4 Khối lệnh bước 1B chỉ nhằm mục đích minh họa cho ý tưởng: Sau khi xếp thứ hạng xong,... syntax *Bước 1A: Thăm dò số liệu EXAMINE VARIABLES =Y1 Y2 Y3 Y4 BY F /PLOT BOXPLOT HISTOGRAM NPPLOT SPREADLEVEL(1) /COMPARE GROUPS /PERCENTILES(5,10,25,50,75,90,95) HAVERAGE /STATISTICS DESCRIPTIVES EXTREME /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL Khối lệnh bước 1A có nội dung thăm dò số liệu, bao gồm: Bảng thống kê mô tả, tính giá trị trung vị, skewness, kurtosis (Xem tài liệu về test Mann Whitney... 1B Như ta th y, sau khi xếp hạng, phân phối của biến Y1 (Amylase t y) trở nên chuẩn (p>0,05) và không còn giá trị cá biệt nào cả Vì lý do n y bạn hoàn toàn có thể làm ANOVA trên chính số liệu thứ hạng n y, nếu chỉ quan tâm đến khuynh hướng khác biệt (cách làm n y làm mất đi ý nghĩa của mô hình định lượng liên tục, không thể mở rộng thành GLM như ANOVA cho thang đo liên tục) Tuy nhiên biến Y3 vẫn không... trung gian g y viêm, nhưng Oleuropein không g y thay đổi ý nghĩa về mức độ hoại tử mô t y cũng như nồng độ amylase Điều n y cho th y Oleuropein không có tác dụng điều trị đối với bệnh viêm t y cấp 28 Nhóm chứng và nhóm can thiệp chưa cho th y khác biệt ý nghĩa, nên b y giờ chúng ta sẽ đưa thêm biến số mới vào mô hình … Meo Bộ số liệu gốc https://drive.google.com/file/d/0B1vaOU1uB8DPMW0yODZ3dVVPdU0/view?usp=sharing... Wallis Nhưng cách làm n y không chính thống và có thể g y hiểu nhầm nếu diễn giải không đúng Ghi chú: Trong thực tế bạn chỉ cần làm duy nhất bước 2A Những bước còn lại chỉ có ý nghĩa minh họa Lưu ý thay đổi nội dung màu đỏ trong các dòng lệnh để phù hợp với nghiên cứu của bạn Với: Y1 ,Y2 ,Y3 ,Y4 là tên các biến cần so sánh, F là biến số phân nhóm Nếu nghiên cứu của bạn có ít biến số hơn, h y xóa bớt Y, ... tham số Kruskal Wallis 1.2 Test Kruskal Wallis K William Kruskal (19192005) Nhà toán học người Mỹ Kiểm định Kruskal- Wallis thiết lập năm 1952 nhà thống kê người Mỹ William kruskal Wilson Wallis, ... biệt Kruskal Wallis IL-6 (pg/mL) Bình thường Bình thường Bình thường ANOVA Kruskal Wallis TNF-α Bình thường Bình thường Bình thường ANOVA Kruskal Wallis Không BT Không BT Không BT Kruskal Wallis. .. Kiểm định Kruskal Wallis yêu cầu số giả định sau Các phân nhóm phải độc lập: Y khảo sát lần cá thể khác (Kruskall Wallis không áp dụng cho thiết kế khảo sát lặp lại theo thời gian) Kruskal Wallis