1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Tài liệu hướng dẫn thống kê y học sử dụng SPSS - KIỂM ĐỊNH mann whitney

21 1,4K 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 21
Dung lượng 1,9 MB

Nội dung

Một hôm nào đó khi so sánh 2 phân nhóm bạn không thể dùng được test t như thường lệ, vì nhiều giả định bị vi phạm, có thể cỡ mẫuquá ít, có thể biến số không phải liên tục, có thể phân ph

Trang 1

Tài liệu hướng dẫn thống kê y học sử dụng SPSS

Kiểm định Mann-Whitney

Trang 2

Khi tôi còn sống ở Paris, buổi chiều sau giờ học tôi thường không về nhà ngay mà chọn ngẫu nhiên mộttrạm Metro nào đó, leo lên và đi dạo phố một vòng Có thể là đồi Montre matre, Quai de Seine hay mộtkhu cổ xưa nào đó Nhưng một lần nọ trạm metro gần nhà tôi bị đóng cửa, tôi phải đi xe bus để thaythế Chiếc xe chạy vòng vèo qua những con đường rất lạ, và dừng lại ở mỗi trạm cách nhau khoảng200m Ngồi trên xe, tôi chợt nhận ra là cảm giác thú vị hơn rất nhiều so với việc chen chúc trong các toametro và đi dưới đường hầm tối đen Kể từ đó, tôi bắt đầu dùng xe bus để dạo chơi ở những con đườngmới lạ Nhờ vậy, tôi biết khá nhiều tuyến bus tiện dụng, khám phá ra nhiều địa chỉ thú vị, ví dụ 1 quán ănViệt Nam, 1 cửa hàng bán đồ âm thanh, hay tiệm bán băng dĩa cũ hay tiệm bánh ngọt…

Trong việc phân tích số liệu có thể bạn cũng sẽ bắt gặp cảm giác tương tự Một hôm nào đó khi so sánh

2 phân nhóm bạn không thể dùng được test t như thường lệ, vì nhiều giả định bị vi phạm, có thể cỡ mẫuquá ít, có thể biến số không phải liên tục, có thể phân phối không chuẩn, hoặc có nhiều điểm giá trị cábiệt Có thể thầy cô sẽ gợi ý bạn dùng 1 test phi tham số để giải quyết vấn đề, trong trường hợp này làtest Mann-Whitney

Test Mann-Whitney rất giản dị, thậm chí bạn có thể làm bằng tay nếu cỡ mẫu thấp, tuy nhiên không phải

ai cũng hiểu về nó và sử dụng nó đúng cách Người lạc quan và ngây thơ sẽ nghĩ đơn giản rằng nó thaythế hoàn toàn cho test t, cho phép chứng minh nhóm này có giá trị cao hơn nhóm khác Người bi quan

sẽ cho rằng test phi tham số không chính xác bằng test t và tìm cách né tránh nó

Thực ra, công dụng, ý nghĩa của 2 loại kiểm định hoàn toàn khác nhau, vì dựa trên những giả thuyết 0khác nhau Test Mann-Whitney thậm chí còn thông dụng hơn Trong đời mình nếu có 5 lần so sánh bằngtest t, thì chắc số lần tôi dùng test Mann-Whitney phải đến 8-9, ngay cả luận văn tốt nghiệp của tôi cũnghoàn toàn dựa vào Mann-Whitney thay vì test t Không phải lúc nào số liệu của chúng ta cũng đẹp, và 1

số chuyên ngành bắt buộc phải dùng test phi tham số ví dụ như chẩn đoán hình ảnh, giải phẫu bệnh lý,thăm dò chức năng giấc ngủ, v.v

Trong tài liệu ngắn này, Bs Khả Nhi sẽ hướng dẫn các bạn làm test Mann-Whitney trên SPSS hoàn toànbằng syntax, nhưng quan trọng nhất là hiểu và diễn giải chính xác kết quả của nó Như thường lệ, mọithứ sẽ được đơn giản hóa tối đa

Chúc các bạn thành công

Lời nói đầu

Trang 3

Quy ước trình bày

Trong tài liệu này chúng ta sẽ làm quen với 3 nhân vật

Bác sĩ Nguyễn Văn Thái

Bác sĩ Thái là một cao thủ thống kê y học trên giang hồ Anh ta sẽ xuất hiện trước mọi vấn đề khó khăn, nhằm đưa ra câu trả lời chính xác và

ôn lại cho bạn những kiến thức cơ bản cũng như chuyên sâu về lý thuyết thống kê Tuy nhiên BS Thái lại rất bận rộn nên không đủ thời gian đi vào cách thực hiện chi tiết Anh ta cũng hay trình bày lý thuyết thuần túy và sử dụng nhiều công thức toán học nên không mấy gần gũi với sinh viên và gây không ít trở ngại cho các bạn vốn dị ứng với thống

kê …

Bác sĩ Lê Ngọc Khả Nhi

Khả Nhi là một nữ bác sĩ trẻ dễ thương và sử dụng thành thạo SPSS Như tên gọi của mình, BS Nhi có tính cách hồn nhiên và ngây thơ như trẻ con, vì vậy cô ấy luôn có khuynh hướng đơn giản hóa tối đa mọi vấn đề Khả Nhi sẽ hướng dẫn các bạn sử dụng SPSS qua từng bước cụ thể, chia sẻ những mẹo vặt, thủ thuật để giúp các bạn đi đến kết quả nhanh và dễ dàng nhất.

Sinh viên Trần Quốc Bảo

Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên cứu khoa học Đây là một cậu sinh viên rất tò mò và luôn đặt ra nhiều câu hỏi liên quan đến thống kê Mặc dù những đế tài do Bảo thực hiện còn đơn giản, nhưng đồng hành với cậu ta, các bạn có cơ hội tích lũy cho mình nhiều kinh nghiệm trong công việc phân tích

số liệu và thiết kế nghiên cứu.

3

Trang 4

4

1

2

Sinh thiết gan

Nhuộm hóa mô miễn dịch với kháng thể

IG222 chống kháng nguyên vỏ E2 của HCV

Nhiễm virus HCV

Xơ gan do HCV

Điều trị ghép gan

Phát hiện tình trạng táinhiễm HCV sau ghép gan

Một bác sĩ nội trú khoa ngoại tiêu hóa thực hiện đề tài khảo sát một

phương pháp nhuộm hóa mô miễn dịch với kháng thể IG222 mAb nhằm

phát hiện biến chứng tái nhiễm virus viêm gan C (HCV) trên mẫu sinh

thiết mô gan sau khi ghép cho những bệnh nhân bị xơ gan giai đoạn cuối

do HCV

Mức độ phản ứng miễn dịch của mẫu mô sau khi nhuộm được đánh giá

một cách bán định lượng như sau: 0: không có tế bào dương tính, 1+, 2+,

3+ tương ứng với <5%, 5-20% và > 20% tế bào dương tính với HCV-E2

Kết quả này được so sánh giữa : Phân nhóm có chẩn đoán xác định tái

nhiễm HCV và phân nhóm bị thải ghép, cũng như giữa phân nhóm hậu

phẫu ≤ 1 tháng và từ 3 tháng trở lên

Cách đánh giá giả định lượng này không cho phép dùng test t, vậy chúng

ta có giải pháp nào thay thế không ?

Đây là một ví dụ điển hình về thiết kế nghiên cứu có đại lượng cần khảo sát làmột biến số giả định lượng, hay thứ hạng Chúng ta không thể sử dụng test t

để so sánh biến số này, thay vào đó ta sẽ sử dụng phương pháp phi tham số làkiểm định Mann-Whitney U hay còn gọi là test tổng thứ hạng Wilcoxon

Mann, Henry B.; Whitney, Donald R (1947) "On a Test of Whether one of Two Random Variables is Stochastically Larger than the Other" Annals of Mathematical Statistics 18 (1): 50–60 doi:10.1214/aoms/1177730491

1 1.1 Tình huống thí dụ

Trang 5

Henry Berthold Mann

Mann-Whitney (1947) là một kiểm định phi tham số.Mục đích ban đầu của nó là dùng để kiểm tra sự tươngđương về tính chất bất định của 2 mẫu phân phối, chứkhông phải tập trung vào một giá trị nhất định nào Saunày, test Mann-Whitney được mở rộng ý nghĩa, chophép so sánh trung vị cũng như đặc tính phân phối như 1giải pháp thay thế cho test t Student

Nguyên tắc của test Mann Whitney là xếp hạng (thứ bâc)cho giá trị của mỗi cá thể sau khi trộn chung 2 phânnhóm với nhau, sau đó so sánh tổng thứ hạng mà mỗiphân nhóm đạt được Nếu có sự khác nhau về đặc tínhphân phối giữa 2 phân nhóm này, những trường hợp cóhạng cao sẽ dồn về một phân nhóm, và những trườnghợp hạng thấp sẽ dồn về phân nhóm còn lại

Nếu 2 phân nhóm có cùng đặc tính phân phối, mỗi thứhạng sẽ có xác suất nằm ở mỗi phân nhóm như nhau

1 1.2 Giới thiệu về phương pháp

Trường hợp II: 2 nhóm A và B có đặc tính phânphối hoàn toàn khác nhau Lúc này test Mann-Whitney có ý nghĩa chứng minh sự khác biệt vềphân phối này

A

B

Trường hợp I: 2 phân nhóm A và B có cùng đặc

tính phân phối (đồng dạng), nhưng lệch nhau

Lúc này Test Mann-Whitney cho phép so sánh

giá trị trung vị giữa A và B

A

B

Nếu 2 phân nhóm A, B có cùng đặc tính phân phối và gần

như chồng lắp lên nhau, test Mann-Whitney cho ra kết quả

âm tính, có thể nói A và B cùng chung 1 quần thể

Trang 6

Như những phương pháp phi tham số khác, Mann-Whitney test cũng dựa vào sự xếp thứ hạng (là 1hình thức chuyển dạng biến số để chuẩn hóa về phân phối) Thí dụ rất đơn giản sau đây nhằm giảithích cách thực hiện thủ công test Mann-Whitney với cỡ mẫu nhỏ.

2 nhóm bạn A và B chơi một trò chơi như sau: mỗi người thả xúc xắc và ghi lại số điểm Thôngthường ta sẽ quyết định thắng bại bằng cách so sánh tổng số điểm của mỗi nhóm Nhưng trongtrường hợp này, nhóm A có ít thành viên hơn nhóm B, nên cách tính điểm dựa vào tổng số khôngthể áp dụng (thiếu công bằng) Một ý kiến khác cho rằng vấn đề ở đây là so sánh mức độ may mắn»,hay « đặc tính phân phối điểm» giữa 2 nhóm Do đó, ta sẽ sử dụng test Mann-Whitney

2

Từ 2 phân nhóm A,B (Bảng 1), ta gộpchung tất cả thành viên lại với nhau,không phân biệt phân nhóm, và xếp hạngcho mỗi trường hợp từ thấp đến cao(Bảng 2)

nhóm, Ri là tổng thứ hạng cho phân nhóm i với ni

trường hợp

Ta có thể tính giá trị U cho mỗi phân nhóm và chọn giá

trị U thấp hơn để tra bảng nhằm kiểm định giả thuyết

0

trị U dao động từ 0 cho tới giá trị lớn nhất có thể đạtđược chính là tích số của 2 cỡ mẫu n1*n2 (khi đó nhómcòn lại xem như có U=0)

𝑈1 + 𝑈2 = 𝑛1𝑛2Nếu ta có cỡ mẫu đủ lớn (>20 trường hợp cho mỗi phânnhóm), U có thể xem như có phân phối chuẩn, lúc này ta

có thể tính giá trị trung bình, độ lệch chuẩn, và U chuẩnhóa:

1 1.2 Giới thiệu về phương pháp

Trang 7

Cách đọc bảng U: Xác định giá trị ngưỡng của Ui tương ứng với n1 và n2 là cỡ mẫu của mỗi phân nhóm Nếugiá trị U của bạn tính ra THẤP hơn ngưỡng này, ta có thể phủ nhận giả thuyết 0 với một xác suất sai lầm nhấtđịnh

Bảng U chỉ sử dụng được cho n1 và n2 < 20 Khi cỡ mẫu n>20 thì không thể dùng bảng U được nữa, nhưng khi

đó có thể xác định trực tiếp giá trị U chuẩn hóa hay giá trị Z của U và từ đó xác định được giá trị p theo phânphối chuẩn

Kích thước ảnh hưởng (Effect size) r được tính bằng công thức của Rosenthal (1991)

0.5 trở lên: kích thước lớn (ảnhhưởng lớn)

1 1.2 Giới thiệu về phương pháp

Trang 8

Loại biến số

Định lượngliên tục

Không liên tục(Thứ hạng)

Test t cho 2 mẫu độc lập

So sánh 1 đại lượng giũa 2 phân nhóm

Ứng dụng của kiểm định U của Mann-Whitney

1 Thay thế cho test T student trong trường hợp : cỡ mẫu quá thấp, có vi phạm các giả định về phân phốibình thường và/hoặc có điểm giá trị cá biệt

2 Bắt buộc sử dụng test Mann-Whitney nếu đại lượng cần so sánh là một biến số không liên tục (thứ hạng, thang điểm, giả định lượng)

Thí dụ:

Những nghiên cứu thuộc chuyên khoa chẩn đoán hình ảnh, giải phẫu bệnh lý (dùng nhiều biến giả định lượng)Các nghiên cứu dùng thang điểm, bảng câu hỏi… (ví dụ thăm dò chức năng giấc ngủ, mức độ đau, chất lượngcuộc sống…

Những mô hình thí nghiệm trên động vật, tế bào, mô Các thí nghiệm Western-Blot, hóa mô miễn dịch (do cỡmẫu quá nhỏ, và/hoặc giá trị không liên tục)

Ghi chú:

+ Một khi test t dùng được thì Mann-Whitney cũng dùng được, thậm chí ít bảo thủ hơn Trong trường hợp test

t cho ra kết quả không rõ nét, bạn có thể cân nhắc dùng test Mann-Whitney thay cho test t, với hy vọng tìm ra

sự khác biệt

+Ý nghĩa của 2 loại test hoàn toàn khác nhau, nên cách diễn giải sẽ khác nhau Test t dựa vào mô hình hồi quytuyến tính và so sánh 2 giá trị trung bình; test Mann-Whitney dựa vào thứ hạng và so sánh đặc tính phân phối(hay trung vị)

Một khi đã dùng test Mann-Whitney bạn cần phải mô tả đặc tính phân phối của 2 phân nhóm (Trung vị, Skewness, Kurtosis, bách phân vị, tứ phân vị…) thay vì dùng trung bình và độ lệch chuẩn, sai số chuẩn nhưthường lệ

1 1.3 Mann-Whitney (không chỉ) thay thế cho test t

Trang 9

Khảo sát đặc tính phân phối của 2 phân nhóm

Tính các giá trị: Trung vị, Skewness, KurtosisKiểm tra giả định phân phối chuẩn

Khảo sát trực quan tính đồng dạng

của phân phối

Đặt ra giả thuyết 0

Thực hiện kiểm định Mann-Whitney

Diễn giải kết quảTính hệ số ảnh hưởng

Vẽ biểu đồ tháp phân phối

So sánh đặc tính phân phối giữa 2 phân nhóm

Giả thuyết 0 được phát biểu tùy theo tínhđồng dạng hay không giữa 2 phân phối…

Xếp hạng, tính thứ hạng trung bình, tổng thứhạng, tính trị số U, U chuẩn hóa (Z), xác định trị

số p

Giữ hay phủ nhận giả thuyết 0

Tính hệ số r theo Rosentham (1991) hoặc theoHans Wendt (1972)

2 2.1 Quy trình trên SPSS

Đầu tiên bạn tạo bảng số liệu với:

Y= đại lượng cần khảo sát, thuộc loại liên tục

F= Biến số phân nhóm, thuộc loại định tính, nhị phân

Ghi chú:

Nhằm minh họa cho ý tưởng: Test Mann-Whitney có thể đứng độc lập 1 mình chứ không chỉ thay thế cho test t,nên tác giả quyết định dùng Y là 1 biến định tính nhiều giá trị (thang điểm) Tuy nhiên ngay cả khi Y là biến thứhạng hoặc giả định lượng, bạn phải đặt kiểu biến số là Scale để SPSS xử lý nó như 1 biến định lượng Tuy nhiênlúc này ta không chú ý về những giá trị như trung bình, độ lệch chuẩn nữa, mà chỉ quan tâm đến đặc điểm phânphối

Trang 10

2 2.1 Quy trình trên SPSS

Để khái quát hóa bộ Syntax, tác giả chỉdùng tên biến rút gọn : Y, F1, F2Nội dung của biến được xác định bằngcách dán nhãn, bao gồm nhãn tên biến vànhãn mã hóa giá trị

Bạn có thể dán nhãn thủ công hoặc dùngsyntax

Sau khi khai báo xong biến, bạn nhập sốliệu

1 Tải file syntax tên « Syntax Mann Whitney.sps» từ Google drive của tác giả về máy của bạn.

2 Mở file syntax bằng cách click chuột 2 lần vào nó, cửa sổ syntax mở ra

https://drive.google.com/file/d/0B1vaOU1uB8DPcnpScWZCZjU0S28/view?usp=sharing

Trang 11

* Khai báo tên biến và mã hóa giá trị

Lệnh Value labels: để dán nhãn mã hóa giá trị cho Y (trongtrường hợp Y là một biến thứ hạng hay giả định lượngGhi chú: Trường hợp Y= biến định lượng liên tục thì không cầnlệnh này

Lệnh Value labels để mã hóa giá trị cho biến F1 và F2Ghi chú: Vì đây là test Mann-Whitney nên F1 hoặc F2 chỉ có thểnhận tối đa 2 giá trị = 2 phân nhóm

2 2.2 Cách thi hành syntax và nội dung bên trong

1

2 Để thi hành một khối lệnh tùy chọn:

1° Đánh dấu chọn 1 khối lệnh cần thi hành 2° Click chuột phải trong syntax editor rồi chọn Run Selection

Nội dung Syntax

Trang 12

* Bước 1A: Thăm dò đặc tính phân phối của Y theo 2 biến F1

DATA: Y=col(source(s), name("Y"))

DATA: F1=col(source(s), name("F1"), unit.category())

COORD: transpose(mirror(rect(dim(1,2))))

GUIDE: axis(dim(1), label("Anti-HCV E2 grade"))

GUIDE: axis(dim(1), opposite(), label("Anti-HCV E2 grade"))

GUIDE: axis(dim(2), label("Frequency"))

GUIDE: axis(dim(3), label("Nhóm hậu phẫu"), opposite(),

gap(0px))

GUIDE: legend(aesthetic(aesthetic.color), null())

SCALE: cat(dim(3), include("1", "2"))

SD, trung vị, bách phân vị, kiểm tra giả địnhphân phối chuẩn, vẽ histogram…

Tiếp theo, ta dùng lệnh Ggraph và quy trình GPL

để vẽ biểu đồ tháp phân phối Biểu đồ này dùng

để so sánh trực quan tính đồng dạng của phânphối ở 2 nhóm (ở đây làm cho F1= nhóm hậuphẫu) Lý do vì sao sẽ được giải thích rõ hơntrong phần diễn giải kết quả

Ghi chú: Cho nghiên cứu của mình, bạn có thể thay đổi nội dung những đoạn màu đỏ, ví dụ tên biến số phân nhóm ở đây là F1, bạn có thể chỉ cần F hoặc đổi thành F2, F3…

GUIDE: axis(dim(1), label("Anti-HCV E2 grade")) và GUIDE: axis(dim(1), opposite(), label("Anti-HCV E2 grade"))

Thay thế bằng tên của biến số Y trong nghiên cứu của bạn

GUIDE: axis(dim(3), label("Nhóm hậu phẫu"), opposite(), gap(0px))

Thay thế bằng tên của biến số F (yếu tố phân nhóm)

interval(position(summary.count(bin.rect(Y*1*F1))),…: Thay F1 bằng tên yếu tố phân nhóm trong nghiên cứu của bạn

2 2.2 Cách thi hành syntax và nội dung bên trong

Trang 13

* Bước 2A: Test Mann-Whitney bằng quy trình Mới

NPTESTS

/INDEPENDENT TEST (Y) GROUP (F1)

/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE

/CRITERIA ALPHA=0.05 CILEVEL=95

NPTESTS

/INDEPENDENT TEST (Y) GROUP (F2)

/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE

/CRITERIA ALPHA=0.05 CILEVEL=95

Khối lệnh 2A: Thực hiện test Mann-Whitney bằngquy trình mới (Cho SPSS phiên bản 18 trở về sau).Ghi chú: Thay thế nội dung Y, F1, F2 bằng tên củabiến số cần so sánh và biến phân nhóm của chínhbạn

Quy trình mới giải quyết vấn đề hoàn toàn tự động,tức là bạn chỉ cần đưa biến số vào mô hình, SPSS sẽ

tự động xác định loại test phi tham số sẽ được sửdụng, tùy theo số phân nhóm cần so sánh; tự độngđặt ra giả thuyết 0, chọn phương pháp tính p gầnđúng hay p chính xác tùy vào cỡ mẫu nhiều hay ít,cuối cùng là đưa ra kết luận cho bạn Ngoài ra quytrình test Mann-Whitney còn vẽ luôn biểu đồ thápcho bạn (như bước 1B mà ta đã phải làm thủ công)

* Bước 2B: Test Mann-Whitney bằng Quy trình Cũ

đó tự thiết lập cấu hình cho test đó

Quy trình Mann-Whitney cũ sẽ xuất ra kết quả gồm

2 bảng thống kê mô tả về giá trị và thứ hạng, bảngkết quả Mann-Whitney U; tuy nhiên nó không vẽbiểu đồ tháp phân phối như quy trình mới

Ghi chú: Bạn chỉ cần chọn 1 trong 2 quy trình, cái nào cũng tốt cả

Cho nghiên cứu của mình, bạn cần thay đổi nội dung màu đỏ, bao gồm tên biến số cần khảo sát (Y), tên biến sốphân nhóm (F) và 2 giá trị của nó (1,2)

Ví dụ bạn muốn so sánh biến Tuổi giữa 2 phân nhóm giới tính (Nam=1) và (Nữ =0) thì dòng lệnh của 2 quy trình sẽthay đổi thành:

NPTESTS

/INDEPENDENT TEST (Tuoi) GROUP (Gioitinh)

/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE

/CRITERIA ALPHA=0.05 CILEVEL=95

NPAR TESTS

/M-W=TuoiBY Gioitinh (0 1)

/STATISTICS=DESCRIPTIVES QUARTILES

/MISSING ANALYSIS

Cho quy trình cũ; bạn đặt thứ tự của giá trị F sao cũng được, kết quả sẽ không đổi

2 2.2 Cách thi hành syntax và nội dung bên trong

Ngày đăng: 22/03/2016, 22:36

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w