1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Tài liệu hướng dẫn thống kê y học sử dụng SPSS - ANOVA HỖN HỢP

67 669 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 67
Dung lượng 3,18 MB

Nội dung

Để góp phần dù nhỏ bé, trong việc cung cấp những công cụ phân thích thống kê giúp các bạn khảo sát mộtvấn đề theo nhiều chiều, kết hợp đa yếu tố và cảm nhận được sự tương tác giữa chúng,

Trang 2

Có lần BS Lê Ngọc Khả Nhi nhận xét về sự giao thoa giữa âm nhạc và cuộc đời mình như sau: « Hoàn cảnhquyết định sở thích, sở thích hình thành nhân cách, và nhân cách quyết định số phận »…

Nhi kể với tôi rằng từ nhỏ đến khi học trung học cô bé chỉ toàn nghe nhạc cổ điển, vì nhà nghèo nên không cócassette, CD, đêm nào cô cũng chỉ làm bạn với chiếc radio và những bản giao hưởng trên đài FM Năm 25 tuổi

cô ấy lần đầu tiên xa nhà và qua Paris du học Tưởng rằng thành phố châu Âu lãng mạn với những phòng hòanhạc nổi tiếng và kho tàng những bản thu âm cổ điển khổng lồ sẽ chắp cánh cho sở thích âm nhạc cổ điển baycao hơn; nhưng Nhi tâm sự rằng khi sống xa quê hương cô ấy mới biết yêu thích âm nhạc Việt Dù vẫn điThéâtre Champs-Ellysée để nghe concerto, giao hưởng; nhưng hằng ngày trên những chuyến metro Nhi chỉcắm tai nghe chìm đắm trong những bản tình ca của Lam Phương, Trịnh Công Sơn, Ngô Thụy Miên… Nhi kểcàng nghe những bài hát xưa cũ đó, càng thấy xót xa cho quê hương và yêu thương con người nhiều hơn Có

sự tương tác nào đó giữa nhạc và lời đã đánh thức những hạt giống tâm hồn của người Việt tưởng chừng ngủquên từ rất lâu Đến bây giờ cô ấy vẫn còn nghe cả 2 dòng nhạc và nhìn cuộc đời bằng đôi mắt lãng mạn, đacảm

Thời gian, nơi chốn, những tác đông từ bên ngoài và thay đổi nội tại từ bên trong… tất cả điều khiển, dẫn dắtchúng ta từng ngày, từng giờ trên con đường mà ta gọi là số phận, ít người cảm nhận được cho đến một thờiđiểm nào đó ta chợt ngỡ ngàng nhìn lại mình, so với người và thấy mình tự thay đổi, thế gian thay đổi từ lúcnào không hay…

Trong y học cũng thế, nếu ở thời kỳ sơ khai người ta nghiên cứu một căn bệnh theo những mô hình đơn lẻ về

cơ chế bệnh sinh nội tại do rối loạn chức năng, hay bên ngoài do nhiễm khuẩn, và tìm cách điều trị chúng, thìngày nay cùng một vấn đề được liên kết với rất nhiều yếu tố, bên trong con người thì khoa học đã đi sâu đếncấp độ gene, phân tử và tế bào, bên ngoài thì có dịch tễ, kinh tế xã hội, môi trường… và những tương tác giữachúng, ví dụ ngành biểu sinh học

Để góp phần dù nhỏ bé, trong việc cung cấp những công cụ phân thích thống kê giúp các bạn khảo sát mộtvấn đề theo nhiều chiều, kết hợp đa yếu tố và cảm nhận được sự tương tác giữa chúng, tài liệu nhỏ này sẽgiới thiệu phương pháp ANOVA hỗn hợp Bằng 1 thí dụ đơn giản, chúng ta sẽ thấy làm cách nào kết hợp 2thiết kế nghiên cứu khác nhau lại làm một để khảo sát cùng lúc hiệu ứng nội tại của thời gian, và bên ngoàicủa bệnh lý

Như những lần trước, mọi vấn đề sẽ được đơn giản hóa tối đa Các bạn có thể làm được cho nghiên cứu củabản thân ngay hôm nay dù ngày hôm qua còn chưa biết ANOVA là gì

Chúc các bạn thành công

Lời nói đầu

Trang 3

Quy ước trình bày

Trong tài liệu này chúng ta sẽ làm quen với 3 nhân vật

Bác sĩ Nguyễn Văn Thái

Bác sĩ Thái là một cao thủ thống kê y học trên giang hồ Anh ta sẽ xuất hiện trước mọi vấn đề khó khăn, nhằm đưa ra câu trả lời chính xác và

ôn lại cho bạn những kiến thức cơ bản cũng như chuyên sâu về lý thuyết thống kê Tuy nhiên BS Thái lại rất bận rộn nên không đủ thời gian đi vào cách thực hiện chi tiết Anh ta cũng hay trình bày lý thuyết thuần túy và sử dụng nhiều công thức toán học nên không mấy gần gũi với sinh viên và gây không ít trở ngại cho các bạn vốn dị ứng với thống

kê …

Bác sĩ Lê Ngọc Khả Nhi

Khả Nhi là một nữ bác sĩ trẻ dễ thương và sử dụng thành thạo SPSS Như tên gọi của mình, BS Nhi có tính cách hồn nhiên và ngây thơ như trẻ con, vì vậy cô ấy luôn có khuynh hướng đơn giản hóa tối đa mọi vấn đề Khả Nhi sẽ hướng dẫn các bạn sử dụng SPSS qua từng bước cụ thể, chia sẻ những mẹo vặt, thủ thuật để giúp các bạn đi đến kết quả nhanh và dễ dàng nhất.

Sinh viên Trần Quốc Bảo

Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên cứu khoa học Đây là một cậu sinh viên rất tò mò và luôn đặt ra nhiều câu hỏi liên quan đến thống kê Mặc dù những đế tài do Bảo thực hiện còn đơn giản, nhưng đồng hành với cậu ta, các bạn có cơ hội tích lũy cho mình nhiều kinh nghiệm trong công việc phân tích

số liệu và thiết kế nghiên cứu.

3

Trang 4

Phân nhóm F1: Bình thường F2: Cao huyết áp F3: Tiền sản giậtF3

Tiền sản giật là một tình trạng bệnh lý trong thai

kỳ được đặc trưng bởi tăng huyết áp và protein

niệu cao Tình trạng bệnh lý có thể phát triển dần

trong thai kỳ và có diễn tiến bất ngờ trong 3

tháng cuối, gây ra những biến chứng nguy hiểm

cho cả mẹ và thai nhi

Một bác sĩ Sản khoa thực hiện nghiên cứu nhằm

khảo sát sự thay đổi nồng độ Magnesium (Mg)

huyết thanh trong thai kỳ Đây là một ion tham

gia vào cơ chế điều hòa huyết áp Nghiên cứu có

thiết kế như sau: Nồng độ Mg trong huyết thanh

được ghi nhận (hồi cứu) 3 lần vào thời điểm 3

tháng đầu, 3 tháng giữa và 3 tháng cuối thai kỳ ở

30 thai phụ chia thành 3 phân nhóm : 1) Thai kỳ

bình thường (hay nhóm chứng âm n=10); 2) Cao

huyết áp đơn thuần (Nhóm chứng dương, n=10)

và 3) Tiền sản giật (n=10)

Câu hỏi nghiên cứu gồm có: (A) Khảo sát khuynh

hướng thay đổi của nồng độ Mg huyết thanh

trong thai kỳ; (B) Liệu có sự khác biệt giữa 3 phân

nhóm ?

Chúng ta phải sử dụng phương pháp thống kê

nào trong trường hợp này ?

1

Bảo thân mến, đây là một thiết kế nghiêncứu khá phức tạp, vì có khả năng 2 yếu tốthời gian mang thai và bệnh lý tương tácvới nhau

Chúng ta sẽ sử dụng phân tích phương saihỗn hợp, là sự kết hợp giữa ANOVA chohiệu ứng bên ngoài và bên trong đốitượng

1.1 Tình huống thí dụ

Trang 5

Cách trình bày trong sách vở làm cho chúng ta dễ ngộ nhận là có nhiều phương pháp ANOVA khác nhau Thực ra chúng đều dựa trên nguyên tắc chung duy nhất đó là mô hình hồi quy tuyến tính Người ta phân chia ra nhiều kiểu ANOVA là dựa trên 2 yếu tố:

+ Số lượng biến số độc lập (hay yếu tố ảnh hưởng ) ?

+ Thiết kế nghiên cứu

Danh pháp chung của ANOVA như sau:

Phân tích phương sai + [số lượng biến số độc lập] yếu tố + (loại thiết kế nghiên cứu)

1 biến số độc lập : ANOVA 1 yếu tố (hay ANOVA đơn biến, tiếng Anh: one way ANOVA)

2 biến số độc lập: ANOVA 2 yếu tố (two ways ANOVA)

Thiết kế nghiên cứu:

Nếu tất cả biến số được khảo sát trên cùng một đối tượng ở nhiều điều kiện khác nhau: Ta có ANOVA cho phép đo lặp lại (repeated measure, within subject ANOVA)

Nếu tất cả biến số khảo sát ở nhiều đối tượng độc lập: Ta có ANOVA cho các nhóm độc lập

Nếu một vài biến số được khảo sát trên đối tượng độc lập, và những biến còn lại được khảo sát trên cùng đối tượng: thiết kế hỗn hợp

Tên phương pháp Số biến độc lập Thiết kế nghiên cứu

ANOVA đơn biến cho phép đo lặp lại 1 Phép đo lặp lại trên cùng đối tượng

ANOVA 2 yếu tố cho phép đo lặp lại 2 Phép đo lặp lại trên cùng đối tượng

ANOVA 2 yếu tố hỗn hợp 2 1 yếu tố được khảo sát trên đối tượng

độc lập Yếu tố còn lại khảo sát nhiều lầntrên cùng đối tượng

Trang 6

R MB

F

R MW

M: hiệu ứng chính của mô hình thí nghiệm

MB: Hiệu ứng do yếu tố bên ngoài (B=between)

MW: Hiệu ứng biến thiên nội tại (W=Within)

Y: Đại lượng được khảo sát

T: Thời điểm khảo sát (thời gian)

F: Yếu tố phân nhóm

R: Sai số do yếu tố ngẫu nhiên, phần bất định

Mô hình thí nghiệm bao gồm:

Y= bo+b2.T+ sai số

Mô hình thí nghiệm bao gồm:

Y= bo+b1.F+ sai số

Bài toán ta đang xét là sự kết hợp của 2 câu hỏi :

1° Khảo sát hiệu ứng của bệnh lý (phân nhóm F) lên giá trị Y (nồng độ Mg)2° Khảo sát hiệu ứng của thời gian mang thai (phân nhóm T) lên giá trị Y (nồng độ Mg)Hai câu hỏi này nếu được giải đáp riêng lẻ, sẽ dẫn tới 2 mô hình mà ta đã biết, là ANOVA đơnbiến (cho F) và ANOVA phép đo lặp lại, cho T

Bài toán ANOVA đơn biếnnhằm mục đích chứng minh bệnh lý (F) gây

ra hiệu ứng ngoại (Between subject) ý nghĩa làm thay đổi giá trị Y giữa 3phân nhóm: F1, F2 và F3

Nó có thể được biểu diễn bằng mô hình hồi quy có dạng:

Y= bo+b1.F+ sai số

Giá trị Y được xác định do hiệu ứng chính, bên ngoài do F gây ra vàphần sai số không rõ nguyên nhân Mục tiêu của ta là chứng minh môhình có ý nghĩa, thông qua test F Sau đó ta dùng post-hoc test hayContrast để so sánh giá trị trung bình Y giữa các phân nhóm F1,F2,F3

Bài toán ANOVA cho phép đo lặp lạinhằm mục đích chứng minh thờigian mang thai gây ra hiệu ứng nội tại (Within subject) ý nghĩa làm thayđổi giá trị Y giữa 3 thời điểm khảo sát, trên cùng đối tượng

Nó có thể được biểu diễn bằng mô hình hồi quy có dạng:

Y= bo+b2.T+ sai số

Giá trị Y được xác định do hiệu ứng chính, nội tại do T gây ra và phần sai

số không rõ nguyên nhân Mục tiêu của ta là chứng minh mô hình có ýnghĩa, thông qua test F Sau đó ta dùng post-hoc test hay Contrast để

so sánh giá trị trung bình Y giữa các phân nhóm T1,T2,T3

Vậy khi 2 bài toán này nhập lại thành 1, điều gì sẽxảy ra ? Mời bạn xem trang sau:

1 1.3 ANOVA đơn biến : hiệu ứng bên ngoài và bên trong

Trang 7

T1 T2 T3

Phân nhóm

M: hiệu ứng chính của mô hình thí nghiệm

MB: Hiệu ứng do yếu tố bên ngoài (B=between)

MW: Hiệu ứng biến thiên nội tại (W=Within)

Y: Đại lượng được khảo sát

T: Thời điểm khảo sát (thời gian)

F: Yếu tố phân nhóm

R: Sai số do yếu tố ngẫu nhiên, phần bất định

Mô hình thí nghiệm bao gồm:

Y= bo+b1.T+b2.F + sai số

Khi ta kết hợp hiệu ứng của cả 2 yếu tố T, F trong một

mô hình thí nghiệm, mô hình sẽ chứa 2 biến số T (thờiđiểm khảo sát) và F (phân nhóm)

Hai trường hợp có thể xảy ra:

Trường hợp thứ nhất là hiệu ứng của F và của T độc lậpvới nhau (không có tương tác giữa T và F) Lúc này môhình sẽ có dạng:

Y= bo+b1.T+b2.F + sai số.

Giá trị Y sẽ được xác định bởi 2 hiệu ứng chính riêng biệtT,F và bởi sai số ngẫu nhiên Đây là phân tích ANOVAhỗn hợp mà ta đang bàn tới

Mục tiêu của chúng ta trong trường hợp này là chứng tỏ

mô hình nói trên có ý nghĩa thống kê, điều này được làmthông qua test F

Sau đó, ta sử dụng test post-hoc hoặc phân tích tươngphản để so sánh giá trị Y giữa các điều kiện khác nhaucủa F và của T

F1 F2 F3

F1-1F2-1F3-1

F1-2F2-2F3-2

F1-3F2-3F3-3

Ma trận đa biến F*T Lần đo (T)

Trang 8

T1 T2 T3

Phân nhóm

M: hiệu ứng chính của mô hình thí nghiệm, bao gồm

MB: Hiệu ứng do yếu tố bên ngoài (B=between)

MW: Hiệu ứng biến thiên nội tại (W=Within)

Y: Đại lượng được khảo sát

T: Thời điểm khảo sát (thời gian)

F: Yếu tố phân nhóm

R: Sai số do yếu tố ngẫu nhiên, phần bất định

T*F: Hiệu ứng của tương tác giữa T và F

F1-1F2-1F3-1

F1-2F2-2F3-2

F1-3F2-3F3-3

Ma trận đa biến F*T Lần đo (T)

T1 T2 T3

Phân nhóm

3 lần ANOVA đơn biến.

Trường hợp thứ 2 của thiết kế ANOVA hỗn hợp, đó làkhi có hiệu ứng tương tác giữa T và F, kí hiệu là T*F

Như vậy mô hình sẽ có dạng: Y= bo+b1.T+b2.F+b3.(T*F) + sai số

Giá trị Y lúc này được xác định nhờ vào hiệu ứng riêngphần của F, của T, hiệu ứng tương tác giữa F và T, vàphần sai số ngẫu nhiên

Lúc này, ta không thể dùng test F đơn thuần để khảosát mô hình chung nữa, thay vào đó ta phải báo cáo về

ý nghĩa thống kê của tương tác T*F, sau đó phân tíchhiệu ứng riêng của T và F bằng cách:

Thực hiện quy trình ANOVA đơn biến cho từng thờiđiểm T1,T2,T3 (3 lần ANOVA đơn biến)

Thực hiện quy trình ANOVA phép đo lặp lại cho từngphân nhóm F1, F2,F3 (3 lần ANOVA phép đo lặp lại)

1 1.5 ANOVA hỗn hợp và sự tương tác giữa 2 yếu tố

Trang 9

3 A

Quy trình ANOVA đơn giản

3A.1 Thực hiện 3 lần ANOVA đơn biến cho T1,T2,T3+ Phân tích sâu: test post hoc hoặc Contrast cho F3A2 Thực hiện 3 lần ANOVA phép đo lặp lại cho F1,F2,F3+ Phân tích sâu: test post hoc hoặc Contrast cho T

Khối lệnh1,2

Khối lệnh3A,3B,4

Đọc kết quả của Khốilệnh 3B, 4

Khối lệnh 5

Khối lệnh 6

Quy trình ANOVA hỗn hợp gồm những bước sau đây

Trong tài liệu lần này, tác giả hoàn toàn dựa vào Syntax thay vì sử dụng giao diện của SPSS

Ưu điểm của việc sử dụng Syntax đó là bạn sẽ tiết kiệm rất nhiều thời gian khi thực hiện các quy trìnhphức tạp , nhất là khi bạn phải thử lại nhiều lần

Nhược điểm của Syntax, dĩ nhiên là tính phổ quát, vì để dùng được Syntax, thiết kế nghiên cứu củabạn phải tương đồng với thí dụ này; hoặc bạn phải thay đổi nội dung Syntax

Dù sao thì ANOVA hỗn hợp cũng là 1 quy trình phức tạp, nên tác giả tập trung phân tích kỹ phần kếtquả để giúp bạn có thể diễn giải kết quả của chính mình Về phần Syntax, bạn sẽ phải thay đổi 1 vàiđiểm nhỏ trước khi thi hành, và phải chạy từng bước, tuy nhiên mọi thứ đều được hướng dẫn dụ thể.Bạn có thể đọc thêm tài liệu về ANOVA đơn biến và ANOVA cho phép đo lặp lại của tác giả để hiểuthêm về 1 số khái niệm như Post hoc test, phân tích tương phản, test F, hệ số ảnh hưởng v.v …

Trang 10

Tạo bảng số liệu

1) Đầu tiên, bạn tạo 1 bảng số liệu gồm 4 biến số:

Phân nhóm: Mã hóa giá trị:

1= Bình thường (nhóm chứng âm)2= Cao huyết áp (Nhóm chứng dương)3= Tiền sản giật (Nhóm nghiên cứu)

Giá trị Mg huyết thanh (đo bằng mg/dL)Tại 3 thời điểm khác nhau trong thai kì:

Y1 Y2 Y3 F

Trang 11

Để thi hành 1 khối lệnh tùy chọn:

Trước hết bạn đánh dấu chọn khối lệnh nàySau đó click chuột phải mở Menu

và chọn Run Selection

Trạng thái của bộ xử lý ở góc dưới phải màn hình

Đang thi hành quy trình…

Đã thực hiện xong quy trình và xuất kết quả

2.3 Cách sử dụng Syntax

Trang 12

* Bước 1: Dán nhãn biến số và nhãn giá trị

F1-3F2-3F3-3

Mục đích của khối lệnh này nhằm :1) Đặt tên cho những biến số Y chỉ thời điểm khảo sát, mỗibiến Y tương ứng với giá trị đo được tại một thời điểm Bạn nên đánh số Y theo thứ tự thời gian, ví dụ Y1 có thể hiểu là lần đo thứ 1, diễn ra trước lần đo thứ 2 (Y2)

2) Đặt tên cho giá trị mã hóa trong biến số F, bạn nên theo quyước : Đánh số từ thấp đến cao, nhóm chứng (âm) luôn nhậngiá trị thấp nhất (ví dụ 0 = không có hoặc 1= Bình thường), các nhóm còn lại nhận giá trị tăng dần nếu chúng mang ý nghĩa 1 thang đo

Ví dụ, bạn có thể phân nhóm độ nặng 1 bệnh lý:

1=Nhẹ, 2=Trung bình, 3=NặngHay 1 liều lượng của 1 thuốc điều trị1=Liều thấp, 2=Liều trung bình, 3=Liều cao

Trong trường hợp phân nhóm không có ý nghĩa định lượng, bạn

có thể đặt tên tùy ý:

1= Nhóm chứng âm, 2=Nhóm chứng dương, 3=Nhóm bệnh lý A, 4= Nhóm bệnh lý B…

(Y,F có thể chứa nhiều hơn 3 giá trị, thậm chí bạn cũng có thểgiảm số phân nhóm còn 2, không bắt buộc luôn phải có 3 phânnhóm

Ví dụ: khảo sát tác dụng của 3 loại thuốc điều trị cao huyết áplên huyết áp bệnh nhân đo ở 4 thời điểm khác nhau trongngày, khối lệnh trên sẽ được đổi thành:

VARIABLE LABELS

Y1 ‘’HA khi vừa thức giấc"

Y2 ‘’HA sau khi vận động"

Y3 ‘’HA sau bữa ăn"

Y4 ‘’HA trước khi ngủ’’

(Chú ý: phải có dấu Ở hàng lệnh cuối cùng

Bạn có thể thay đổi nội dung gì ?

+ Số phân nhóm cho Y và F (từ 2 trở lên)

+ Tên của các phân nhóm F

+ Tên của phân nhóm Y

3 Nội dung Syntax 3.1 Bước 1

Trang 13

* Bước 2: Thăm dò số liệu :

Kiểm tra giả định phân phối chuẩn của

Y1,2,3 tùy theo F

setprintback=OFF

EXAMINEVARIABLES=Y1 Y2 Y3 BYF

+ Thực hiện test Kolmogorov Smirnov và Shapiro-Wilk

để kiểm tra giả định phân phối chuẩn của Y trong từngphân nhóm F

+ Vẽ biểu đồ QQ, cũng để kiểm tra giả định phân phốichuẩn của Y trong từng phân nhóm F

+ Vẽ biểu đồ Box-plot để phát hiện những điểm giá trịcác biệt > 1,5 -3 lần độ lêch chuẩn

Bạn có thể thay đổi nội dung gì ?

+ Thêm bớt biến số Y, tùy theo thiết kế nghiên

cứu của bạn có bao nhiêu lần đo

Lưu ý: Cần thi hành riêng khối lệnh này, trước khi

làm những bước tiếp theo Đây là các giả định

cần kiểm tra trước khi bạn làm ANOVA Trong

trường hợp có vi phạm giả định bạn phải xử trí ,

kiểm tra lại nhiều lần

Nếu có vi phạm giả định có thể không làm được

ANOVA, phải thay bằng test phi tham số, hoặc

phải làm ANOVA song song cho 2 mẫu số liệu Vì

vậy không nên đi nhiều bước cùng lúc

Ví dụ: Nếu nghiên cứu của bạn có 5 biến số Y (5 lần đo), được đánh số thứ tự từ Y1 đến Y5, bạn sẽ thay đổi lệnh trênthành:

EXAMINEVARIABLES=Y1 Y2 Y3Y4 Y5BYF

3 Nội dung Syntax 3.2 Bước 2

Trang 14

* Bước 3: Chạy mô hình ANOVA hỗn hợp,

* Bước 3A: Kiểm tra trực quan sự tương tác

giữa lần đo và phân nhóm

COORD: rect(dim(1,2), cluster(3,0))

GUIDE: axis(dim(2), label("Giá trị trung bình

của Y"))

GUIDE:

legend(aesthetic(aesthetic.color.interior),

label("Phân nhóm"))

SCALE: cat(dim(3), include("0", "1", "2"))

SCALE: linear(dim(2), include(0))

Công dụng của biểu đồ này để kiểm tra tương tác của T và F(sẽ giải thích rõ hơn bên dưới)

Bạn có thể thêm bớt biến số Y tùy theo nghiên cứu của bạn

có bao nhiêu lần đo:

Trang 15

SCALE: cat(dim(1), include("0", "1", "2"))

SCALE: linear(dim(2), include(0))

Bạn có thể thêm bớt biến số Y tùy theo nghiên cứu của bạn

có bao nhiêu lần đo:

Trang 16

* Bước 3B: Quy trình ANOVA hỗn hợp có sao lưu

Đặt tên của đại lượng cần khảo sát, ví dụ ở đây là Mg

Đặt tên cho biến số ảo T chỉ thời điểm, ví dụ: ThaikyKiểu phân tích tương phản đơn giản, chọn nhóm 1 làmnhóm chứng

Khối lệnh 3B có nội dung:

1) Thực hiện quy trình ANOVA hỗn hợp với 2 yếu tố :biến số ảo T chỉ thời gian, và biến số phân nhóm F

2) Quy trình bao gồm các bước kiểm định ban đầu chogiả định Sphericity, sau đó là test F, kiểm tra quan hệtương tác giữa T và F, ý nghĩa của hiệu ứng chính3) Thực hiện test Post-hoc theo 2 phương pháp:Bonferroni và Games-Howell

4) Vẽ biểu đồ khảo sát Y theo thời gian và cho 3 phânnhóm khác nhau Trình bày bảng thống kê mô tả giá trị

Y trung bình cho mỗi phân nhóm

5) Sao lưu sai số chuẩn hóa của mô hình dưới 1 biến số

có tên gọi là SRE_i

Lưu ý:

Nên chạy riêng khối lệnh này trước khi đi những bước tiếp theo, vì tùy theo kết quả của ý nghĩa yếu tố tương tác mà

ta sẽ có 2 hướng đi khác nhau

Bạn có thể thay đổi nội dung gì ?

+ Tên của đại lượng cần khảo sát

Ví dụ nghiên cứu của bạn đo đường huyết, thì lệnh /MEASURE sẽ được thay đổi thành:

/MEASURE=Duonghuyet

+Tên của biến số ảo T

Ví dụ bạn có thể gọi T= thời gian, và nếu bạn có 4 lần đo thì đổi lại con số:

/WSFACTOR=Thoigian 4 Simple(1)

Chú ý: tên bạn chọn không được chứa khoảng trắng, nên viết liền nhau

+ Không nên thay đổi thứ tự các biến số Y, nếu không sẽ gây nhầm lẫn trong quá trình bắt cặp Y và T Nếu bạn có 4 lần đo, chỉ cần thêm Y4 vào sau Y3:

GLM Y1 Y2 Y3Y4 BY F

3 Nội dung Syntax 3.4 Bước 3B

Trang 17

• Trước khi chạy bước 4, nhìn lại bảng số liệu để xem

giá trị sai số Z có cao hơn 3 ?

SORT CASES SRE_1.

DELETE VARIABLES SRE_1, SRE_2, SRE_3.

Như ghi chú; trước khi thi hành bước 4, bạn nên nhìn lạibảng số liệu, cột biến số SRE_n để phát hiện những giá trịphân tán quá mức của sai số

SRE_n chính là sai số chuẩn hóa (hay Z score của sai số), case nào có Z>3 là không phù hợp với mô hình vì sai sốquá cao

Khối lệnh thứ 4 nhằm mục đích kiểm tra phẩm chất của

mô hình, thông qua giả định là sai số phân phối chuẩn Nội dung là vẽ biểu đồ Q-Q cho sai số chuẩn hóa ở từngphân nhóm F

Sau khi vẽ xong biểu đồ, tất cả biến sai số sẽ bị xóa sạch

để phục hồi lại bảng số liệu

Lưu ý: Nếu biến số F có nhiều hơn 3 giá trị bạn sẽ cóthêm biến số SRE_4, SRE_5…, bạn phải thêm chúng vàohàng lệnh PPLOT và DELETE VARIABLES

Ta tạm dừng lại ở bước 4 và đọc kết quả để kiểm tra quan hệ tương tác giữa T và F

Nếu không có quan hệ tương tác ý nghĩa, ta không cần làm thêm bước 5 và 6, kết quả như vậy là đủ

Nhưng nếu tương tác có ý nghĩa (bạn sẽ được hướng dẫn cách phát hiện điều này); bạn sẽ phải làm thêm bước 5 và 6.Mục đích của chúng là khảo sát những hiệu ứng riêng của F và T

Quy trình ANOVA đơn giản

Thực hiện 3 lần ANOVA đơn biến cho T1,T2,T3+ Phân tích sâu: test post hoc hoặc Contrast cho FThực hiện 3 lần ANOVA phép đo lặp lại cho F1,F2,F3+ Phân tích sâu: test post hoc hoặc Contrast cho T

Đọc kết quả của Khốilệnh 3B, 4

Khối lệnh 5

Khối lệnh 6

Nội dung Syntax 3.5 Bước 4

Trang 18

* Bước 5: ANOVA đơn biến khảo sát yếu tố F

cho mỗi thời điểm T1,T2,T3

BOOTSTRAP

/SAMPLING

METHOD=STRATIFIED(STRATA=F )

/VARIABLES TARGET=Y1 INPUT=F

/CRITERIA CILEVEL=95 CITYPE=BCA

/VARIABLES TARGET=Y2 INPUT=F

/CRITERIA CILEVEL=95 CITYPE=BCA

/VARIABLES TARGET=Y3 INPUT=F

/CRITERIA CILEVEL=95 CITYPE=BCA

Khối lệnh thứ 5 mới nhìn có vẻ dài, nhưng thực chất chỉ là

1 quy trình đơn giản lặp lại 3 lần

Nội dung của bước 5 là làm ANOVA đơn biến theo F, chomỗi thời điểm T1, T2,T3 Bạn để ý sẽ thấy nội dung của mỗiquy trình ANOVA giống nhau, chỉ khác biến số Y:

Ở thời điểm T1, tương ứng với Y1

Ví dụ nếu bạn có 4 lần đo, bạn chỉ cần copy 1 khối lệnh bất

kì, ví dụ Y1, sau đó thay đổi tên biến số Y1 thành Y4:

BOOTSTRAP

/SAMPLING METHOD=STRATIFIED(STRATA=F )/VARIABLES TARGET=Y4INPUT=F

NSAMPLES=1000/MISSING USERMISSING=EXCLUDẸ

UNIANOVAY4BY F/METHOD=SSTYPE(3)/INTERCEPT=INCLUDE/POSTHOC=F(BONFERRONI GH)/PRINT=OPOWER ETASQ

/CRITERIA=ALPHẶ05)/DESIGN=F

Mỗi quy trình ANOVA đơn biến gồm các bước:

+ Thực hiện Bootstrap để nâng cỡ mẫu lên nhiều lần, mộtcách ngẫu nhiên

+ Kiểm định Levene kiểm tra giả định phương sai đồngnhất

+ Test F cho mô hình Y(F), kiểm tra ý nghĩa hiệu ứng của F,tính Effect size bằng hệ số Eta bình phương

+ Làm test Post-hoc Bonferroni và Games-Howel

3 Nội dung Syntax 3.6 Bước 5

Trang 19

* Bước 6: ANOVA-phép đo lặp lại cho từng phân

SPLIT FILE OFF

Bạn có thể thay đổi nội dung gì ?

+ Tên của đại lượng cần khảo sát.

Ví dụ nghiên cứu của bạn đo đường huyết, thì lệnh

/MEASURE sẽ được thay đổi thành:

/MEASURE=Duonghuyet

+Tên của biến số ảo T

Ví dụ bạn có thể gọi T= thời gian, và nếu bạn có 4

lần đo thì đổi lại con số:

/WSFACTOR=Thoigian 4 Simple(1)

Chú ý: bạn cần thay đổi tất cả tên gọi của biến T

trong các hàng lệnh: /PLOT, /EMMEANS,

/WSDESIGN=

Chú ý: tên bạn chọn không được chứa khoảng

trắng, nên viết liền nhau

+ Không nên thay đổi thứ tự các biến số Y, nếu

không sẽ gây nhầm lẫn trong quá trình bắt cặp Y và

T Nếu bạn có 4 lần đo, chỉ cần thêm Y4 vào sau Y3:

GLM Y1 Y2 Y3Y4 BY F

Khối lệnh thứ 6 được gắn liền với khối thứ 5, cả 2 nằm trongquy trình khảo sát hiệu ứng riêng của F hoặc T cho từng phânnhóm của yếu tố còn lại

Nội dung của bước 6 là thực hiện ANOVA cho phép đo lặp lại

ở từng phân nhóm của F, như vậy cùng 1 quy trình ANOVA được làm 3 lần tương ứng cho F1, F2 và F3

Nếu để ý bạn sẽ thấy phần lõi của quy trình hoàn toàn giốngnhư mô hình GLM trong bước 3B, chỉ khác không có sao lưusai số

Điểm quan trọng là trước khi thi hành quy trình ANOVA chophép đo lặp lại này, ta đã dùng lệnh SPLIT FILE để chia mẫukhảo sát ra làm nhiều phần, theo giá trị của F

Ví dụ F có 3 giá trị 1,2,3 thì quy trình ANOVA sẽ lần lượt đượcthực hiện với F=1, F=2, F=3

Quy trình ANOVA cho phép đo lặp lại gồm có:

1) Kiểm định ban đầu cho giả định Sphericity bằng testMauchly, sau đó là test F, kiểm tra ý nghĩa của hiệu ứngchính do T gây ra

2) Thực hiện test Post-hoc theo 2 phương pháp: Bonferroni

và Games-Howell3) Phân tích tương phản đơn giản: so sánh T2 và T3 với T14) bảng thống kê mô tả giá trị Y trung bình cho mỗi phânnhóm và biểu đồ

3 Nội dung Syntax 3.7 Bước 6

Trang 20

* This is a lower bound of the true significance.

a Lilliefors Significance Correction

Có 2 cách kiểm tra giả định phân phối chuẩn:

1) Phương pháp toán học - Sử dụng kiểm định Shapiro-Wilk hoặc Kolmogorov-Smirnov : tối ưu

cho trường hợp cỡ mẫu không quá lớn (<50 trường hợp), nhưng lại không đáng tin cậy khi cỡmẫu quá nhỏ)

2) Phương pháp trực quan - Sử dụng biểu đồ Q-Q plot: Thích hợp cho những cỡ mẫu lớn (> 50

trường hợp)

Với kiểm định Kolmogorov Smirnov hoặc Shapiro-Wilk, kết quả ta trông đợi là p > 0.05

Nếu p<0.05 tức là giả định phân phối chuẩn đã bị vi phạm

Trong thí dụ này, phân phối của giá trị nồng độ phosphate.serum là bình thường cho cả 3 lần đo (p> 0.05)

4 Diễn giải kết quả thăm dò số liệu 4.1 Giả định phân phối chuẩn

Trang 21

Nếu giả định phân phối

2)Sử dụng 2 phương pháp phi tham số riêng biệt cho 2 yếu tố độc lập

kiểm định Kruskal-Wallis, là giải pháp thay thế cho ANOVA đơn biến độc lập,kiểm định Friedman, là giải pháp thay thế cho ANOVA trong phép đo lặp lại)3)Bỏ qua vi phạmvà vẫn làm phân tích ANOVA hỗn hợp (Thực ra điều kiệnphân phối không phải là tuyệt đối bắt buộc)

4) Làm ANOVA hỗn hợp song song cho 2 mẫu số liệu: nguyên thủy và đãchuyển dạng (logarit hóa), so sánh kết quả của chúng với nhau

Lời khuyên của BS Nhi:

Nếu bạn có bất thường về số liệu, bạn NÊN báo cáo điều đó cụ thể trong phần kếtquả, nhất là cách bạn xử lý những điểm giá trị cá biệt, lựa chọn test thống kê Nếuphân phối lệch trái hay phải, ngoài giá trị trung bình và SD bạn nên cung cấp thêm giátrị của Skewness và Kurtosis (trong bảng kết quả Explore)

Hành động này sẽ đánh vào tâm lý của các nhà phê bình và giám khảo, loại bỏ nghingờ về việc gian lận và ngụy tạo số liệu, nhất là khi kết quả của bạn quá hoàn hảo.Người đọc sẽ nghĩ: Tác giả là một người thành thật và nắm vững phương pháp thốngkê

P<0,00001 à ? Kết quả này quá đẹp nên không thể tin được

Nghiên cứu sinh

Phải triệu hồi chuyên viên thống

kê ra làm chứng

4 Diễn giải kết quả thăm dò số liệu 4.1 Giả định phân phối chuẩn

Trang 22

Biểu đồ Box-plots cho phép phát hiện nhanh các điểm giá trị cá biệt (chênh lệch quá lớn sovới độ lệch chuẩn) Biểu đồ này cũng dùng để báo cáo kết quả.

Bất cứ điểm nào có khoảng cách > 1,5 lần chiều dài của error bar được xem là điểm ngoạilai

Nếu cách biệt lớn hơn 3 lần, đó là giá trị rất phân cực

Trong hình trên, không có điểm giá trị ngoại lai nào được phát hiện

Nếu có trường hợp giá trị cá biệt, SPSS sẽ đánh dấu bằng mã số thứ tự cho phép ta định vị

dễ dàng trường hợp đó trong bảng số liệu

4 Diễn giải kết quả thăm dò số liệu 4.2 Phát hiện giá trị cá biệt

Trang 23

Nếu có điểm giá trị ngoại

lai, ta phải xử trí thế nào

?4

+ Đầu tiên, cần tìm hiểu nguyên nhân của giá trị cá biệt này: Có thể do nhập số liệu

sai ? Có thể do sai sót trong quá trình đo (đa số trường hợp) Sau khi đã loại trừ tất

cả nguyên nhân chủ quan, ta buộc phải kết luận rằng giá trị đó có thực và hoàn

toàn ngẫu nhiên (rất hiếm gặp, đồng nghĩa với việc đối tượng thực sự là một ngoại

lệ)

Nếu ta quyết định vẫn giữ điểm ngoại lai; ta có nhiều lựa chọn:

1)Sử dụng phương pháp phi tham số: kiểm định Kruskal-Wallis, là giải pháp thay

thế cho ANOVA đơn biến độc lập, kiểm định Friedman, là giải pháp thay thế cho

ANOVA trong phép đo lặp lại

2) Thay đổi giá trị cá biệtbằng 1 giá trị khác gần với nó nhất có thể (ví dụ: nếu giá

trị x = 10 được xem là quá khác biệt, ta có thể thử giá trị x=8 , vẫn là giá trị cao

nhất nhưng còn nằm trong giới hạn cho phép) (Lưu ý: giá trị thay thế có thể là giả

hay thật đều được)

3)Chuyển dạng biến số(ví dụ đổi sang thang đo logarit)

4) Cầu kì hơn: Ta tiến hành làmANOVA song songcho 2 trường hợp: Có và không

có điểm giá trị ngoại lai, nếu kết quả tương tự nhau, ta giữ, ngược lại ta bỏ

Loại bỏ giá trị luôn là lựa chọn cuối cùng:

Nếu ta quyết định bỏ điểm ngoại lai này, cỡ mẫu sẽ bị giảm đi một số trường hợp

tương ứng cho cả những lần đo khác và effect size sẽ bị ảnh hưởng

23

Diễn giải kết quả thăm dò số liệu

4.2 Phát hiện giá trị cá biệt

Trang 24

Biểu đồ đoạn thẳng, mô tả sự biến thiên của giá trị Y trung bình tại 3thời điểm khác nhau (trục hoành) và 3 phân nhóm khác nhau (màusắc)

Công dụng của biều đồ này là để phát hiện 1 cách trực quan sự tươngtác giữa biến số T (thời gian) và biến số phân nhóm (F: bệnh lý)

Trong trường hợp có quan hệ tương tác, một trong

những đường thẳng (nối 2 thời điểm T; tương ứng với

1 trong 3 phân nhóm F) sẽ cắt những đường còn lại

Đường thẳng giao nhau = Có tương tác giữa T và F

Trong trường hợp không có quan hệ tương tác, Các đườngthẳng sẽ không cắt nhau, chúng gần như song song.Đường thẳng không cắt nhau = Không có tương tác giữa T

5 Diễn giải kết quả bước 3: 5.1 Kiểm tra yếu tố tương tác (3A)

Trang 25

Biểu đồ hình cột, mô tả sự biến thiên của giá trị Y trung bình tại 3 thờiđiểm khác nhau (trục hoành) và 3 phân nhóm khác nhau (màu sắc).Công dụng của biều đồ này cũng à để phát hiện 1 cách trực quan sựtương tác giữa biến số T (thời gian) và biến số phân nhóm (F: bệnh lý).Bạn chỉ cần chú ý 2 đặc điểm:

+ Khuynh hướng biến thiên của giá trị Y theo thời gian : giống nhau haykhác nhau giữa các phân nhóm (ví dụ F1,F2) ?

+Khoảng cách d giữa 2 đỉnh của cột kết quả: giống nhau hay khác nhaugiữa các thời điểm T1, T2, T3 ?

Trường hợp A: Không có quan hệ tương tác giữa T và F:

Khuynh hướng biến thiên là như nhau ở F1 và F2 (2 đường thẳng gầnnhư song song)

Khoảng cách d bằng nhau tại tất cả thời điểm: d1=d2=d3

Trường hợp B: Có quan hệ tương tác giữa T và F:

Khuynh hướng biến thiên của F1 và F2 khác nhau (những đường thẳngcắt nhau)

Khoảng cách d khác nhau giữa 2 thời điểm

Trong trường hợp còn nghi ngờ, chúng ta sẽ dùng kết quả MANOVA vàwithin subject ANOVA để kiểm tra quan hệ tương tác này

Cách thứ 2 để kiểm tra về quan hệ tương tác giữa T

và F là sử dụng biểu đồ hình cột

5 Diễn giải kết quả bước 3: 5.1 Kiểm tra yếu tố tương tác (3A)

Trang 26

Within-Subjects Factors

Measure: Mg

Thaiky

DependentVariable

Bảng Within-subjects factors cho biết nội dung của

biến số chỉ điều kiện thí nghiệm lặp lại theo thời

gian:

Tên của biến số ảo T

dùng để chỉ khái niệm « Số lần đo » , « Mốc thời

gian » hay « điều kiện khảo sát » trong phép đo lặp

lại Trong thí dụ này, ta đặt tên cho biến số ảo này là

« Thai kỳ »

Cột thứ 1 cho biết Biến số ảo T nhận 3 giá trị 1,2,3

tương ứng với 3 mốc thời gian từ trước tới sau: 3

tháng đầu, 3 tháng giữa và 3 tháng cuối

Cột thứ 2 cho ta biết tên 3 biến số « thực » trong

bảng số liệu để chỉ kết quả của đại lượng Y ở từng

thời điểm khảo sát Trong thí dụ này chính là 3 biến

số Y1,Y2,Y3

Điểm quan trọng nhất trong bảng này là kiểm chứng

lại sự bắt cặp giữa biến số thực (Y1,Y2,Y3) và biến

số ảo (T1,T2,T3)

Vấn đề không phải nằm ở tên của biến số Y mà là

thứ tự của chúng trong Syntax:

GLMY1 Y2 Y3BYF

Thứ tự này chính là thời gian từ Trước  Sau

Giả sử bạn nhầm lẫn khi viết Syntax như sau: Y1 Y3

Y2, như vậy Y3 sẽ được gán cho T2 và Y2 được gán

Cột thứ 1 cho biết biến F nhận 3 giá trị mã hóa

dưới dạng số: 1, 2, 3

Cột thứ 2 cho biết ý nghĩa của mỗi giá trị:

F=1 tương ứng với nhóm chứng âm: Thai kỳ bìnhthường

F=2 tương ứng nhóm chứng dương: Cao huyết

áp đơn thuần trong thai kỳF=3 tương ứng với phân nhóm Tiền sản giật

Cột thứ 3 cho biết số trường hợp tương ứng cho

Trang 27

Tiếp theo, cũng trong bước 3B, bảng Descriptive Statistics trình bày kết quả thống kê mô tả giá trị biến

số Y (nồng độ Mg) tương ứng với tất cả điều kiện tổ hợp từ 2 biến T và F

T có 3 giá trị: 3 tháng đầu, 3 tháng giữa, 3 tháng cuối

F có 3 giá trị: Bình thường, Cao huyết áp, Tiền sản giật

Như vậy ta có ma trận 3x3 =9 trạng thái của Y

Cho mỗi trạng thái, bảng cung cấp số trường hợp (N), gí trị Y trung bình và độ lệch chuẩn

Thông tin này cho phép chúng ta hình dung ra khuynh hướng của sự biến thiên, thí dụ:

- Có vẻ như nồng độ Mg giảm dần trong thai kỳ ở cả 3 phân nhóm

- 3 tháng đầu: không có khác biệt rõ rệt giữa 3 phân nhóm

- Từ 3 tháng giữa đến 3 tháng cuối phân nhóm cao huyết áp và tiền sản giật dường như có Mg thấphơn so với nhóm bình thường

- Có vẻ như nồng độ Mg giảm nhiều nhất trong phân nhóm tiền sản giật

Vân vân

Tuy nhiên, thật vô ích nếu chỉ nhìn vào kết quả thô này trong khi ta chưa biết gì về ý nghĩa thống kê của

nó, không biết vai trò của biến T và F, tương tác giữa chúng… vả lại nhận xét dựa vào hình vẽ (trựcquan) còn dễ và nhanh hơn, nên các bạn không nên mất nhiều thời gian nhìn vào bảng này mà hãydành nó cho phần báo cáo kết quả, ta chỉ việc đi nhanh sang bước tiếp theo

5 Diễn giải kết quả bước 3B: 5.3 Bảng thống kê mô tả

Trang 28

Box's Test of Equality of

Covariance Matrices a

Box's M 16,655

F

Giá trị F df1 Độ tự do 1

df2

Sig ,033

Tests the null hypothesis that the

observed covariance matrices of

the dependent variables are equal

Nếu các phân nhóm (F) của bạn có cỡ mẫu không đồng đều (n khác nhau ở 3 phân nhóm), bạn sẽ phải kiểm tra giả định về sự tương đồng của hiệp phương sai (Covariance) bằng test Box.

Giá trị trông đợi của p là >0,05 Nếu kết quả test Box cho ra p<0,05 thì số liệu đã vi phạm giả định về đồng nhất hiệp phương sai.

Tin buồn ở đây là khả năng vi phạm giả định rất cao trong thực tế (trong thí dụ hình bên, tôi chỉ thêm 1 trường hợp duy nhất vào nhóm F3 mà kết quả p của test Box đã <0,05).

Thực ra giả định về đồng nhất covariance không hoàn toàn bắt buộc ,

sự vi phạm giả định này chỉ làm tăng nguy cơ sai lầm khi phân tích sự tương tác giữa T và F Giải pháp cho trường hợp vi phạm giả định là:

1 Ghi nhận vi phạm khi báo cáo kết quả, nhưng vẫn tiến hành làm ANOVA hỗn hợp như thường.

Không thực hiện ANOVA hỗn hợp, thay vào đó ta sẽ làm ANOVA cho phép đo lặp lại ở từng phân nhóm F1, F2, F3.

Vẫn thực hiện quy trình ANOVA hỗn hợp, nhưng khi xét tương tác giữa T và F nên dùng phương pháp Pillai hơn là trị số Lambda của Wilk, hoặc bỏ hẳn không xét ý nghĩa của quan hệ tương tác.nữa.

2

3

Trong thí dụ của chúng ta, 3 phân nhóm

có cỡ mẫu bằng nhau (n1=n1=n3=10)

nên test Box không thể thực hiện được

(và không cần thiết nữa) Trong khi chạy

Syntax bạn sẽ thấy SPSS báo lỗi và trong

phần kết quả không có bảng Box test.

5 Diễn giải kết quả bước 3B: 5.4 Kiểm tra giả định đồng nhất về hiệp phương sai (3B)

Trang 29

Multivariate Tests a

Hypothesis df

Error

df Sig.

Partial Eta Squared

Noncent

Parameter

Observed Power d

Biến số T Pillai's Trace

Wilks' Lambda

Hotelling's Trace Roy's Largest

Root T*F

Root

a Design: Intercept + F Within Subjects Design: T

Kết quả chính của ANOVA đa biến bắt đầu bằng bảng Multivariate test (MANOVA) Quy trình này có mục đíchphát hiện sự khác biệt ý nghĩa giữa những phân nhóm nhỏ của F trong ma trận FxT (tổ hợp giữa F và T) Quytrình này giống hệt khi bạn làm MANOVA (phân tích phương sai đa biến), chỉ có điểm đặc biệt đó là với ANOVAhỗn hợp thì ma trận được tạo ra từ 1 biến số giả chỉ thời gian (T) và biến số phân nhóm (F) trong khi MANOVAxét 2 yếu tố phân nhóm thực sự

Bảng Multivariate tests sử dụng 4 phương pháp: Pillai ; Hotelling, trị số Lambda (Λ) của Wilk và Roy

+ Khi các phân nhóm có cỡ mẫu bằng nhau, nên sử dụng Lambda của Wilk vì nó là tiêu chuẩn tối ưu

+ Khi các phân nhóm không đồng đều về cỡ mẫu và Box test có p<0,05 : nên sử dụng Pillai’s Trace

Kết quả gồm 2 phần:

Hiệu ứng riêng phần của T (đối với mô hình gồm hằng số Intercept và F)

Hiệu ứng tương tác giữa T và F (Đây là mục đích quan trọng nhất ta cần quan tâm)

Cách đọc kết quả cũng giống F test trong ANOVA đơn giản

Đầu tiên đọc giá trị p là xác suất tìm ra trị số F cao hơn F được tính Sự khác biệt có ý nghĩa nếu p<0,05 Ngượclại p>0,05 là không có sự khác biệt ý nghĩa

Sau đó ghi nhận hệ số F và 2 độ tự do df của giả thuyết chính (hypothesis) và của sai số

Cuối cùng đọc kết quả Effect size là hệ số Eta bình phương bộ phận

Kết quả được báo cáo như sau:

Có sự khác biệt ý nghĩa giữa các phân nhóm của (F) trong tổ hợp tạo ra giữa (T) và (F)

F ( , ) = ;p= ; Wilk’s lambda = , kích thước ảnh hưởng η2 =

e

c d b a *

5 Diễn giải kết quả bước 3B: 5.5 Bảng MANOVA: kiểm tra ý nghĩa sự tương tác T*F

Trang 30

Multivariate Tests a

Hypothesis df

Error

df Sig.

Partial Eta Squared

Noncent

Parameter

Observed Power d

Thaiky Pillai's Trace ,850 73,478 b 2,000 26,000 ,000 ,850 146,956 1,000

Wilks' Lambda ,150 73,478 b 2,000 26,000 ,000 ,850 146,956 1,000

Hotelling's

Trace

5,652 73,478 b 2,000 26,000 ,000 ,850 146,956 1,000 Roy's Largest

Root

5,652 73,478 b 2,000 26,000 ,000 ,850 146,956 1,000 Thaiky * F Pillai's Trace ,531 4,880 4,000 54,000 ,002 ,266 19,521 ,942

b Exact statistic

c The statistic is an upper bound on F that yields a lower bound on the significance level.

d Computed using alpha = ,05

Trong thí dụ này, kết quả có thể được diễn giải như

sau:

Có sự khác biệt ý nghĩa về nồng độ Mg giữa các phân

nhóm tạo ra từ sự tổ hợp giữa 3 giai đoạn trong thai

kỳ và 3 tình trạng bệnh lý (bình thường, CHA thai kỳ

và tiền sản giật) Bản thân biến số giai đoạn thai kỳ có

hiệu ứng ý nghĩa với F(2,26)=73,478; p<0,001; Wilk’s

Λ= 0,150; η2 bộ phận = 0,85.

Có tương tác ý nghĩa giữa giai đoạn thai kỳ và phân

nhóm bệnh lý gây ảnh hưởng lên nồng độ Mg, với

F(4,52)=5,037; p<0,001; Wilk’s Λ= 0,519; η2 bộ phận

= 0,279.

Ghi chú; MANOVA chỉ là một trong 3 phương pháp

phát hiện ra quan hệ tương tác giữa T và F; 2 cách

còn lại là phương pháp trực quan, dựa vào biểu đồ

cột và biểu đồ đoạn thẳng đã trình bày ở trên.

Samuel S Wilks(1906-1964)Nhà toán học người MỹTìm ra phân phối LambdaỨng dụng trong MANOVA

W

5 Diễn giải kết quả bước 3B: 5.5 Bảng MANOVA: kiểm tra ý nghĩa sự tương tác T*F

Trang 31

Kiểm tra hiệu ứng tương tác

Quy trình ANOVA hỗn hợp

F test cho mô hình chứa T và FPhân tích sâu: test post hoc hoặc Contrast cho FPhân tích sâu: test post hoc hoặc Contrast cho T

Quy trình ANOVA đơn giản

Thực hiện 3 lần ANOVA đơn biến cho T1,T2,T3

+ Phân tích sâu: test post hoc hoặc Contrast cho F

Thực hiện 3 lần ANOVA phép đo lặp lại cho F1,F2,F3

+ Phân tích sâu: test post hoc hoặc Contrast cho T

Đọc kết quả của Khốilệnh 3B, 4

Khối lệnh 5

Khối lệnh 6

6A Kết quả ANOVA hỗn hợp Trường hợp KHÔNG có tương tác ý nghĩa

Trong trường hợp KHÔNG có tương tác ý nghĩa giữa T và F:

Nếu không có tương tác ý nghĩa giữa T và F, ta có thể báo cáo kết quả về hiệu ứng chính của T vàcủa F Kết quả này nằm ngay trong bước 3B, gồm 2 bảng Within Subject và Between subjecttương ứng với (1) ANOVA lặp lại cho T và (2) ANOVA đơn biến cho F so sánh giá trị trung bình của

Y ở 3 lần đo

Sau đó tùy vào ý nghĩa thống kê của hiệu ứng chính này, ta sẽ xem tiếp kết quả Post-hoc test

Trang 32

Mauchly's Test of Sphericity a

Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is

proportional to an identity matrix

a Design: Intercept + F Within Subjects Design: Thaiky

b May be used to adjust the degrees of freedom for the averaged tests of significance Corrected tests are displayed in

the Tests of Within-Subjects Effects table

Bước đầu tiên trong ANOVA cho phép đo lặp lại là kiểm tra giả

định Sphericity bằng test Mauchly Giả định Sphericity có thể

hiểu theo cách đơn giản như sự đồng nhất về phương sai giữa

những lần đo khác nhau Bạn chỉ cần đọc giá trị p để biết kết quả

test; giá trị trông đợi là p>0,05 cho thấy giả định Sphericity không

bị vi phạm Ngược lại, p<0,05 có nghĩa là đã có sự vi phạm giả

định, hay khác biệt về phương sai giữa 3 lần đo

Khi có vi phạm giả định, kết quả của F test phải được hiệu chỉnh bởi

1 trong 3 hệ số Epsilon Giá trị của 3 hệ số được ghi ra trong bảng

nhưng ta không cần chú ý đến chúng ngay, vì sẽ gặp lại trong bảng

test F

Tương tác F*THiệu ứng của T

Sai số ngẫu

nhiên

Hiệu ứng củaF

ANOVA đơn biến

ANOVA cho phép đo lặp lại

Mô hình Y(F)

Mô hình Y(T, T*F)

ANOVA hỗn hợp

Quy trình phân tích phương sai hỗn hợp có thể tách ra làm 2 mảnh:

1) ANOVA đơn biến với mô hình Y=bo+b1*F1+b2*F2+b3*F3+sai số; để khảo sát hiệu ứng bên ngoài của F

2) ANOVA cho phép đo lặp lại với mô hình Y=bo+b1*T+b2*TxF+sai số; để khảo sát hiệu ứng của nội tại của T

và hiệu ứng tương tác T*F

Ta sẽ bắt đầu bằng phân tích ANOVA cho phép đo lặp lại:

1 2

John W Mauchly(1907 –1980)Nhà vật lý Mỹ Tác giảphương pháp kiểm tra giảđịnh đồng nhất phươngsai trong phép đo lặp lại

M

6A Trường hợp KHÔNG có tương tác ý nghĩa 6.A-1) Khảo sát hiệu ứng bên trong: Kiểm tra giả định Sphericity

Trang 33

Bây giờ ta đọc kết quả của ANOVA cho phép đo lặp lại

Như tên gọi của nó, bảng Test of Within subject Effects nhằm khảo sát những hiệu ứng (effect) hay vaitrò của những yếu tố gây ra biến thiên nội tại (tức là sự thay đổi giá trị Y qua nhiều lần đo khác nhau, ở cùng 1 đối tượng)

Trong bảng này quan trọng nhất là kiểm tra quan hệ tương tác giữa thời gian T (lần đo) và bệnh lý (F)Phép kiểm F theo Fisher có thể được hiểu theo 2 cách:

+ Dùng để kiểm tra liệu khác biệt của Y giữa các thời điểm khác nhau có ý nghĩa thống kê ?

+ Dùng để kiểm tra ý nghĩa thống kê của một mô hình dự báo giá trị Y tùy theo giá trị của T = thời

điểm

Đây chính là một phân tích ANOVA cho phép đo lặp lại, chỉ khác là ngoài hiệu ứng chính do biến số T gây ra và sai số ngẫu nhiên, mô hình ANOVA hỗn hợp còn chứa thêm 1 yếu tố tương tác chỉ hiệu ứnggây ra do sự tổ hợp (tương tác) giữa T và F Sự tương tác có thể hiểu như: Giá trị F (ví dụ F=3: tiền sảngiật) tương tác với thời điểm T(ví dụ 3 tháng cuối) sẽ gây ra hiệu ứng thay đổi Y theo 1 cách nào đó.Như vậy mô hình Within Subject Effect trong ANOVA hỗn hợp có dạng:

Y= hằng số + b1*T+ b2*FxT + sai số

Cấu trúc của bảng:

Cột thứ 1 liệt kê những yếu tố cần khảo sát:

Yếu tố T chỉ thời điểm khảo sát (hay hiệu

ứng chính)

Yếu tố tương tác giữa T và F, hay tích số giá

trị của biến số ảo T và phân nhóm F

Sai số, hoặc yếu tố ngẫu nhiên không thể

MS hay trung bình bình phương, một cách tổng quát: MS

= SS/df

Độ tự do Mỗi giá trị F được xác định từ 2 độ tự do: df củahiệu ứng chính và df của sai số (dfR), trong bày văn bảnkhoa học viết là: F(dfM,dfR)

d

6A Trường hợp KHÔNG có tương tác ý nghĩa 6.A-1) Khảo sát hiệu ứng bên trong: Cách đọc bảng Within Subject effect

Ngày đăng: 22/03/2016, 22:35

TỪ KHÓA LIÊN QUAN

w