Mô hình lập luận này rất thường được sử dụng trong những nghiên cứu sinh lý bệnh học, ví dụ ta có thể dùng nó để chứng minh: Một hoạt chất X kích thích hoặc ức chế quá trình tổng hợp 1 c
Trang 1Tài liệu hướng dẫn
Trang 2Lời mở đầu
Năm 2005 tôi đến Paris và bắt đầu chặng đường du học của mình Mùa đông đầu tiên lạnh đếnmức làm tôi co ro suốt ngày trong một góc phòng trọ Phần lớn thời gian tôi chỉ biết ôm cuốn sáchdược lý học phân tử và nghe nhạc Chopin như một thằng tự kỉ Kết quả là tôi bị ám ảnh bởi đủ loạireceptor, chất thông tin thứ cấp, inhibitor và stimulator…
Càng đọc nhiều tài liệu, tôi càng nhìn thấy con đường nghiên cứu y học dài vô tận Thầy tôi nói rằng
để vượt qua hố sâu giữa cơ chế bệnh sinh và hoạt chất điều trị có khi phải mất 10-20 năm và conđường đó là công trình của rất nhiều nhà khoa học, người thì đặt 1 viên sỏi nhỏ, người thì khuân 1tảng đá lớn, thế hệ sau tiếp bước thế hệ đi trước Trên con đường đó, có một câu hỏi luôn làm trăntrở người nghiên cứu sinh: Giữa viên đá này và viên đá kia là khoảng trống, cái gì có thể lấp đầykhoảng trống đó ?
Thấm thoát 10 năm trôi qua, hành trình của tôi đã rẽ bước khá xa so với mục tiêu ban đầu, nhưngcâu hỏi đó vẫn còn nằm trong đầu tôi Trí tưởng tượng và giả thuyết có thể đặt ra là vô hạn; nhưng
để chứng minh giả thuyết bằng thống kê đôi khi rất nan giải Có lần tôi đã mô tả sức mạnh của môhình hồi quy, hệ số tương quan, nhưng đa số trường hợp chúng không cho phép kết luận điều gìmang tính nhân quả cả
Một phương pháp thống kê cho phép bạn trả lời câu hỏi : Cái gì ? Tại sao ? … thực sự thú vị Tài liệunày sẽ giới thiệu về một phương pháp như vậy Hy vọng tài liệu này sẽ giải phóng trí tưởng tượngcủa các bạn mỗi khi bắt tay vào phân tích số liệu và làm kết quả của bạn vượt ra khỏi phân tíchtương quan thông thường
Như thường lệ, bác sĩ Khả Nhi sẽ giúp các bạn nhìn mọi thứ một cách đơn giản tối đa
Chúc các bạn thành công
2
Trang 3Quy ước trình bày
Trong tài liệu này chúng ta sẽ làm quen với 3 nhân vật
Bác sĩ Nguyễn Văn Thái
Bác sĩ Thái là một cao thủ thống kê y học trên giang hồ Anh ta sẽ xuấthiện trước mọi vấn đề khó khăn, nhằm đưa ra câu trả lời chính xác và
ôn lại cho bạn những kiến thức cơ bản cũng như chuyên sâu về lýthuyết thống kê Tuy nhiên BS Thái lại rất bận rộn nên không đủ thờigian đi vào cách thực hiện chi tiết Anh ta cũng hay trình bày lý thuyếtthuần túy và sử dụng nhiều công thức toán học nên không mấy gần gũivới sinh viên và gây không ít trở ngại cho các bạn vốn dị ứng với thống
kê …
Bác sĩ Lê Ngọc Khả Nhi
Khả Nhi là một nữ bác sĩ trẻ dễ thương và sử dụng thànhthạo SPSS Như tên gọi của mình, BS Nhi có tính cách hồnnhiên và ngây thơ như trẻ con, vì vậy cô ấy luôn có khuynhhướng đơn giản hóa tối đa mọi vấn đề Khả Nhi sẽ hướngdẫn các bạn sử dụng SPSS qua từng bước cụ thể, chia sẻnhững mẹo vặt, thủ thuật để giúp các bạn đi đến kết quảnhanh và dễ dàng nhất
Sinh viên Trần Quốc Bảo
Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiêncứu khoa học Đây là một cậu sinh viên rất tò mò và luôn đặt ranhiều câu hỏi liên quan đến thống kê Mặc dù những đế tài do Bảothực hiện còn đơn giản, nhưng đồng hành với cậu ta, các bạn có cơhội tích lũy cho mình nhiều kinh nghiệm trong công việc phân tích
số liệu và thiết kế nghiên cứu
3
Trang 4Trong bệnh lý xơ phổi, cấu trúc phế nang maomạch bị thay đổi bởi hiện tượng viêm, xơ hóa vàlàm giảm khả năng trao đổi khí, dẫn đến tình trạngsuy hô hấp mạn tính.
Một bác sĩ muốn thử nghiệm một phương phápthăm dò chức năng hô hấp mới gọi là kỹ thuật đokhuếch tán đôi Kỹ thuật này cho phép đo cùng lúc
hệ số khuếch tán của 2 loại khí là CO và NO, sau đódựa vào TLNO,TLCO để ước tính thông số Dm hay
độ dẫn xuất của màng phế nang mao mạch Dmcho phép đánh giá tổng quát đặc tính vật lý củamàng phế nang mao mạch như độ dày, diện tíchkhả dụng, từ đó biết được phẩm chất của lớp màngnày có bị suy giảm hay không Dm càng giảm thìkhả năng trao đổi khí từ phế nang vào mao mạchphổi càng kém
Sau khi đo Dm ở 14 bệnh nhân xơ phổi, bác sĩ nàycho các bệnh nhân thực hiện nghiệm pháp gắngsức hô hấp-tim mạch Bệnh nhân được đo lưulượng O2 và CO2 trong khí thở, kết hợp với phântích khí máu động mạch và đo độ bão hòa O2(SpO2) Nghiệm pháp gắng sức cho ra rất nhiềuthông số, giúp đánh giá đồng bộ chức năng hô hấp,tim mạch để thích nghi với điều kiện tăng nhu cầutrao đổi chất của cơ thể
Anh bác sĩ muốn chứng minh một số giả thuyếtsinh lý học có yếu tố nhân quả giữa tính chất màngphế nang mao mạch (nguyên nhân) và mức độ bãohòa oxy ngoại biên (hậu quả) Phân tích tươngquan thông thường không cho phép làm việc này.Chúng ta còn giải pháp nào khác không ?
Bảo thân mến, chúng ta có thể áp dụng phân tích yếu
tố trung gian (Mediator) Phương pháp này dựa trên lýthuyết về mô hình hồi quy tuyến tính đa biến …
1 1.1 Tình huống thí dụ
Trang 5Mục đích của việc khảo sát yếu tố trung gian là để giải thích cơ
chế tác động của yếu tố X lên kết quả Y thông qua 1 yếu tố M:
Yếu tố X dẫn tới sự thay đổi của yếu tố M, từ đó M gây ra sự
thay đổi của yếu tố Y; hay X tác động lên Y thông qua M Nói
cách khác: M giữ vai trò trung gian trong quan hệ giữa X và Y
Mô hình lập luận này rất thường được sử dụng trong những
nghiên cứu sinh lý bệnh học, ví dụ ta có thể dùng nó để chứng
minh: Một hoạt chất X kích thích (hoặc ức chế) quá trình tổng
hợp 1 chất trung gian M, từ đó làm tăng/giảm đáp ứng sinh lý
Y nào đó
Trong thí dụ nghiên cứu chức năng trao đổi khí ở bệnh nhân
xơ phổi này, ta có thể đặt ra giả thuyết về một cơ chế sinh lý
như sau:
Độ dẫn xuất màng phế nang mao mạch (Dm) giảm có thể hạn
chế hiệu quả trao đổi khí giữa phế nang và tuần hoàn ngoại vi,
vốn được đánh giá bằng thông số (DA-aO2), từ đó gây ra hiện
tượng thiếu oxy máu ngoại biên (khảo sát bằng PaO2) khi
bệnh nhân thực hiện test gắng sức
Để chứng minh giả thuyết này, ta sẽ lập ra mô hình với 3 biến
số:
X = biến số độc lập hay yếu tố dự báo, là Dm: độ dẫn xuất của
màng phế nang mao mạch
Y= biến số phụ thuộc hay giá trị dự báo, là PaO2 max (ở điều
kiện gắng sức tối đa)
M= biến số trung gian, là chênh lệch áp suất của khí O2 giữa
phế nang và động mạch ; D(A-a)O2 (ở điều kiện cơ bản, nghỉ
tĩnh)
Y X
M
Y X
Trang 6a b c’
Y X
M
X
Yếu tố trung gian Biến số độc lập Biến số phụ thuộc
Hiệu ứng gián tiếp (MY)
Hiệu ứng gián tiếp
(XM)
Hiệu ứng trực tiếp XY Hiệu ứng toàn thể của X Y
1 1.2 Giới thiệu
Trang 7Y X
c’
Y X
c
Y=bo+c*X Khảo sát hiệu ứng toàn thể Hệ số hồi quy c và R2Y,X
M = b’o+a*X Khảo sát hiệu ứng gián tiếp XM Hệ số hồi quy a và R2M,X
Y=b”o+c’*X+b*M Khảo sát hiệu ứng gián tiếp MY
và hiệu ứng trực tiếp XY
Hệ số hồi quy c’, b và
R2Y,MX
1 Phân tích hồi quy dựa vào 3 mô hình
2 Khảo sát hiệu ứng gián tiếp
A) Phân tích định lượng:
Tính hệ số hiệu ứng gián tiếp
Dạng chưa chuẩn hóa: (a*b)Dạng chuẩn hóa 1 phần: a*b/(SD của Y), theo Mac Kinnon (2008)Dạng chuẩn hóa toàn phần: = (a*b/SD của Y)*(SD của X)
So sánh giữa hiệu ứng gián tiếp và trực tiếp hay toàn thể:
Dựa vào tỉ số
Tỉ số hiệu ứng Gián tiếp/Toàn thể = (a*b)/c
Tỉ số hiệu ứng Gián tiếp/Trực tiếp = (a*b)/c’
Dựa vào hệ số Kappa bình phương của Preacher và Kelley (2011)
K2= (a*b)/max(a*b)
Tính hệ số R 2 của hiệu ứng gián tiếp, R2biểu thị cho phần biến thiên của
Y có thể được giải thích bởi M
R2M = R2Y,M – (R2Y,MX-R2Y,X)B) Phân tích định tính :
Kiểm định Sobel (1982)
2 2.1 Quy trình thực hiện
Trang 81) Cách đánh giá dựa vào tỉ sốít khi được sử dụng vì có nhiều nhược điểm như :
- Kém chính xác: chúng đòi hỏi cỡ mẫu lớn (khoảng vài trăm trường hợp)
- Khó diễn giải và dễ gây ngộ nhận: Những tỉ số này không thể được diễn đạt với ý nghĩa
phân phối (chúng là tỉ số, không phải tỉ lệ), (a*b) không có liên quan gì đến c hay c’ Thậtvậy, các tỉ số này có thể > 1, thậm chí nhận giá trị âm (nếu a,b trái dấu) Ví dụ trườnghợp: M tỉ lệ nghịch với X, nhưng tỉ lệ thuận với Y
2) Giá trị R 2 M có thể được diễn giải như hệ số R2 của một phương trình hồi quy thôngthường, tuy nhiên nó cũng có thể gây ngộ nhận: R2M không bắt buộc phải nằm trongkhoảng 0-1 như ta thường nghĩ, nó thậm chí có thể nhận giá trị âm
3) Hệ số kappa bình phươnglà giải pháp tối ưu nhất, vì nó biểu thị hiệu ứng gián tiếp như
1 tỉ lệ giữa kích thước hiệu ứng gián tiếp thực tế quan sát được và hiệu ứng gián tiếp tối đa
có thể đạt tới trong quần thể
Đây là 1 tỉ lệ thực sự, giá trị của K2dao động từ 0 tới 1
K2=0 cho thấy hiệu ứng gián tiếp rất nhỏ (1 cách tương đối) so với giá trị lớn nhất theo lýthuyết
K2gần bằng 1 cho thấy hiệu ứng gián tiếp rất lớn, gần với giá trị cao nhất mà nó có thể đạtđược
K2có thể được diễn giải như sau :
0.01 : hiệu ứng gián tiếp rất nhỏ, không đáng kể
0.09 : hiệu ứng gián tiếp trung bình
0.25 : hiệu ứng gián tiếp lớn, quan trọng
4 điều kiện cần có :
(1) X phải cho phép dự báo một cách ý nghĩa giá trị của Y trong mô hình Y(X)
(2) X phải dự báo một cách ý nghĩa giá trị của M trong mô hình M(X)
(3) M phải dự báo có ý nghĩa giá trị của Y trong mô hình Y(X,M)
(4) Hiệu ứng trực tiếp nhỏ hơn hiệu ứng toàn thể (c’ < c), hay nói cách khác, hiệu ứng giántiếp có ý nghĩa
2 2.2 Tiêu chuẩn đánh giá
Trang 9Test Sobel
SPSS không hỗ trợ phân tích yếu tố trung gian và dĩ nhiên không tồn tại chứ cnăng testSobel, tuy nhiên chúng ta hoàn toàn có thể làm test này một cách thủ công, nó có cùngnguyên lý như test t hoặc test Z
Đầu tiên ta tính giá trị của t , là tỉ số giữa hệ số hiệu ứng gián tiếp (a*b) và sai số chuẩncủa hiệu ứng gián tiếp :
𝑏 + 𝑏2+ 𝜎2
𝑎Trong đó:
a là hệ số hồi quy giữa X và M,
b là hệ số hồi quy giữa Y và M
𝜎2là phương sai của a và b
Sau đó ta có thể dùng bảng phân phối t hoặc phân phối bình thường cho giá trị chuẩnhóa của t (Z) để kiểm tra giả thuyết 0: (a*b) = 0
Nếu test Sobel cho kết quả dương tính (p<0,05) ta loại bỏ giả thuyết H0: (ab)=0, tức làchấp nhận (ab) ≠ 0 hay nói cách khác hiệu ứng gián tiếp X-M-Y có ý nghĩa thống kê và M
có vai trò trung gian trong quan hệ giữa X và Y
Nếu test Sobel âm tính (p>0,05) và hoặc khoảng tin cậy của (ab) có chứa giá trị 0, ta cóthể phủ nhận sự tồn tại của hiệu ứng gián tiếp X-M-Y hay nói cách khác M không có vaitrò trung gian
Tuy nhiên, kết quả test Sobel chỉ có ý nghĩa tham khảo Độ chính xác của test Sobel rấtkém, nó phụ thuộc vào cỡ mẫu, để chắc chắn ta phải áp dụng phương pháp Bootstrap
và tính khoảng tin cậy 95% của hệ số tương quan (a*b)
Quan trọng nhất trong phân tích yếu tố trung gian không phải là giá trị p mà là khoảngtin cậy 95% của hệ số hồi quy gián tiếp không chứa giá trị 0
2 2.3 Kiểm định Sobel
Trang 10Trước năm 2013, chúng ta bắt buộc phải làm phân tích
yếu tố trung gian hoàn toàn thủ công, bằng cách thực
hiện 3 lần phân tích hồi quy cho 3 mô hình X-Y, X-M và
X-M-Y, sau đó dựa vào kết quả 3 mô hình này để khảo
sát hiệu ứng gián tiếp, trực tiếp, tính effect size và làm
test Sobel Quy trình này tốn khá nhiều thời gian và bắt
buộc lập trình cú pháp lệnh trên SPSS nên làm nản lòng
sinh viên; nhất là khi họ có quá nhiều giả thuyết cần
kiểm tra
Tuy nhiên hiện nay quy trình phân tích yếu tố trung gian
trên SPSS trở nên đơn giản và nhanh chóng nhờ vào
công cụ Process của tiến sĩ Andrew F Hayes (đại học
Ohio, Hoa kỳ)
Như ta biết, SPSS cho phép mở rộng chức năng cơ bản
bằng cách nạp thêm những gói macro syntax được lập
trình sẵn Ít người tận dụng chức năng lập trình trong
SPSS vì vậy chúng ta không có nhiều package để xài như
trong R Tuy vậy, package của SPSS có giao diện đồ họa
(GUI) nên rất thân thiện và dễ sử dụng hơn nhiều so với
package của R
Process là một tập hợp những mã lệnh (syntax) SPSS và
hơn thế nữa, nó đi kèm với giao diện đồ họa tương tác,
cho phép bạn thao tác dễ dàng như vẫn thường làm
trên SPSS Bạn không cần hiểu về cú pháp lệnh SPSS
nhưng vẫn có thể xuất kết quả chỉ với vài lần nhấn nút
Nếu không nhờ vào Process, tài liệu hướng dẫn này chắc
phải dài gấp 3 lần
Để tưởng nhớ công lao của tiến sĩ Hayes, khi thực hiện
luận văn, bài báo khoa học, xin bạn hãy trích dẫn lại
nguồn gốc công trình của ông như dưới đây:
Hayes,AF (2013) Introduction to mediation,
moderation, and conditional process analysis New York:
The Guilford Press
Andrew F Hayes, Ph.D.Department of PsychologyThe Ohio State UniversityColumbus, OH 43210,U.S.A
Công cụ Process rất mạnh , nó cho phép phântích yếu tố trung gian và yếu tố điều tiết trên
74 loại mô hình khác nhau, có những mô hìnhphức tạp hơn rất nhiều so với ví dụ cơ bản
mà chúng ta đang thực hiện Nếu tò mò, bạn
có thể tìm đọc quyển sách này của tác giả đểtìm hiểu sâu hơn
3 3.1 Công cụ Process của Hayes
Trang 11Hướng dẫn cài đặt Process cho SPSS:
Lưu ý: Gói công cụ này chỉ tương thích với SPSS 18 trở lên, nếu bạn đang sử dụng phiên bản cũ hơn,hãy cài phiên bản SPSS mới nhất trước khi sử dụng Process
Truy cập trang web sau để tải gói tập tin Process.zip
Sau khi giải nén, bạn sẽ thấy những tập tin bên trong, quan trọng nhất là file process.psd chứa bộ mã
Trang 12Bạn khởi động chương trình SPSS với vai trò quản trị,
nhấp chuột phải vào icon SPSS và chọn thi hành với
quyền hạn administrator Điều này rất cần thiết vì chỉ có
quản trị viên mới có quyền thay đổi cấu trúc những gì có
trong thư mục Programme Nếu bạn sử dụng SPSS tại
công ty hay thư viện trường, bạn không có quyền cài
Process, bạn chỉ có thể cài cho máy tính của riêng bạn
7
8
3 3.3 Cài đặt công cụ Process
Trang 13Sau khi cài đặt xong, trong menu Analysis> Regression sẽ xuất hiện thêm chức năng Process
by Andrew F Hayes
9
3 3.3 Cài đặt công cụ Process
Trang 14M X
Y
M
Y X
Đầu tiên bạn sẽ tạo những biến số cần khảo sát trong SPSS Đối với phân tích yếu tố trung gian, giả thuyếtnghiên cứu ban đầu của chúng ta gồm có ít nhất 3 biến số :
Biến số kết quả (hay phụ thuộc ) Y : ở đây là PaO2 max = áp suất riêng phần oxy máu động mạch ở trạng tháigắng sức tối đa Đây là hiệu quả của quá trình cung cấp oxy nhằm thích ứng với sự tăng nhu cầu chuyển hóa của
cơ thể trong nghiệm pháp gắng sức
Biến số nguyên nhân (yếu tố dự báo độc lập) X: ở đây là DmCO = khả năng dẫn xuất khí CO của màng phế nangmao mạch Thông số này đại diện cho tính chất vật lý của màng phế nang mao mạch
Biến số trung gian cần khảo sát (M): ở đây là DAaO2base = chênh lệch nồng độ Oxy giữa phế nang và độngmạch, đo ở điều kiện nghỉ tĩnh Thông số này đại diện cho khả năng trao đổi khí oxy giữa phế nang và tuần hoànngoại biên
Lưu ý: Để sử dụng được Process, bạn cần chú ý một vài điểm như sau:
- Process chỉ « hiểu » được biến kiểu số, bạn không thể dùng kí tự (string) Nếu có biến số định tính bạn phải
mã hóa nó dưới dạng số (1,2,3,4…) và nó sẽ được hiểu như biến định lượng thứ hạng
- Process chỉ chấp nhận tên biến số dài tối đa 8 kí tự Bạn nên rút gọn tên biến số càng ngắn càng tốt và dùngchức năng Label để giải thích ý nghĩa nếu sợ quên
- Bạn không được đặt tên biến số là XXX (có vẻ kì cục, nhưng đơn giản là bạn không được dùng tên này, vì đây
là 1 variable riêng trong mã lệnh của Process)
- Tiếp theo bạn có thể nhập số liệu vào bảng SPSS
- như hình bên cạnh
4 4.1 Nhập số liệu
Trang 152
3
Để kích hoạt gói công cụ Process, bạn lần lượt truy
nhập vào: Analyze > Regression > PROCESS …
Hình bên cạnh là giao diện của Process,
như bạn thấy, nó có cấu trúc tương tự như
bất cứ hộp thoại nào trong SPSS nên bạn sẽ
làm quen với công cụ này rất nhanh
Tên mô hình
Bước đầu tiên bạn sẽ làm là xác định
mô hình nào sẽ được áp dụng Theo
mặc định, Process mở sẵn mô hình số 4,
tương ứng với phân tích yếu tố trung
gian đơn giản với X,Y và M mà ta đang
nhắm tới
Process cho phép phân tích tới 74 mô
hình khác nhau Để tìm hiểu sâu hơn
bạn có thể đọc thêm tài liệu gốc của
Hayes Muốn áp dụng mô hình nào, bạn
chỉ cần chọn nó trong danh sách
4
4 4.2 Khởi động