Muoán bieát caùc bieán coù moái quan heä vôùi nhau nhö theá naøo, chuùng ta phaûi tính heä soá töông quan (kyù hieäu laø r) Heä soá töông quan naøy coù giaù trò töø –1 ñeán 1. Keát quaû heä soá töông quan seõ coù yù nghóa khaùc nhau nhö sau r=0 :khoâng coù moái töông quan giöõa hai bieán quan taâm r 0 : coù moái töông quan thuaän 0 < |r| < 0.2 : coù moái töông quan raát yeáu 0.2< |r| < 0.5 : coù moái töông quan yeáu 0.5 < |r| < 0.7 : coù moái töông quan trung bình 0.7 < |r| < 0.9 : coù moái töông quan chaët cheõ > 0.9 : coù töông quan raát chaët cheõ. Nhöng treân thöïc teá 0.5 < |r| < 0.7 ñaõ ñöôïc goïi laø töông quan khaù chaët cheõ. Chuùng ta coù theå tính ñöôïc heä soá töông quan baèng leänh corr hay pwcorr vaø chuùng ta coù theå xem ñöôïc caùc moái töông quan naøy baèng ño àthò khi goõ leänh graph matrix ñeå veõ ma traän ñoà thò chaám ñieåm. Cuù phaùp
Trang 1Tương quan giữa hai hay nhiều biến định lượng
Muốn biết các biến có mối quan hệ với nhau như thế nào, chúng ta phải tính hệ số tương quan (ký hiệu là r)
Hệ số tương quan này có giá trị từ –1 đến 1 Kết quả hệ số tương quan sẽ có ý nghĩa khác nhau như sau
r=0 :không có mối tương quan giữa hai biến quan tâm r<0 : có mối tương quan nghịch
r > 0 : có mối tương quan thuận
0 < |r| < 0.2 : có mối tương quan rất yếu
0.2< |r| < 0.5 : có mối tương quan yếu
0.5 < |r| < 0.7 : có mối tương quan trung bình
0.7 < |r| < 0.9 : có mối tương quan chặt chẽ
> 0.9 : có tương quan rất chặt chẽ
Nhưng trên thực tế 0.5 < |r| < 0.7 đã được gọi là tương quan khá chặt chẽ
Chúng ta có thể tính được hệ số tương quan bằng lệnh corr hay pwcorr và chúng ta có thể xem được các mối tương quan này bằng đo àthị khi gõ lệnh graph matrix để vẽ ma trận
đồ thị chấm điểm
Cú pháp
corr varlist Tính hệ số tương quan giữa hai biến hay
hoặc ma trận các hệ số tương quan của một nhóm các biến định lượng
pwcprr varlist , sig
star(5) Tính hệ số tương quan cho từng cặp biến định lượng, các option có ý nghĩa:
sig : thể hiện mức ý nghĩa thống kê của hệ số tương quan
star(5) : đánh dấu sao vào những hệ số có ý nghĩa thống kê
graph matrix varlist….,
options Các option sử dụng trong câu lệnh này là:
half : chỉ vẽ một bên ma trận
jitter( ) :loại bỏ ngẫu nhiên
những chấm tượng trưng cho số lượng rất nhỏ tránh việc những điểm này trùng lắp.
msymbol( ) : biểu tượng của dấu chấm (hình tròn dạng lỗ, tròn…)
msize( …) : kích thước của chấm diagonal : dán nhãn cho các biến
Trang 2corr weight iq age
(obs=100)
| weight iq age
weight | 1.0000
iq | -0.2920 1.0000
age | 0.4131 -0.4363 1.0000
Diễn giải kết quả:
Hệ số tương quan này được tính trên số quan sát chung (obs=100) trả lời đủ ba câu hỏi về weight, iq, và age Số
Giữa iq và weight có tương quan nghịch yếu
Giữa weight và age có tương quan thuận yếu
Giữa iq và age có tương quan nghịch yếu
pwcorr weight iq age, obs sig star(5)
| weight iq age
weight | 1.0000
|
| 106
|
iq | -0.3006* 1.0000
| 0.0025
| 99 109
|
age | 0.4152* -0.4366* 1.0000
| 0.0000 0.0000
| 106 109 117
|
Diễn giải kết quả
Lệnh pwcorr dùng để tính hệ số tương quan cho từng cặp biến vì vậy dân số để tính sẽ khác nhau tùy vào từng số quan sát trả lời đủ cho cặp biến đó
Có 99 quan sát trả lời đủ hai câu hỏi về iq và weight Giữa biến iq và biến weight có tương quan nghịch yếu có
ý nghĩa thống kê (p=0,00025)
Có 106 quan sát trả lời đủ hai câu hỏi về age và weight Giữa biến age và biến weight có tương quan thuận yếu có
ý nghĩa thống kê (p=0,000)
Có 109 quan sát trả lời đủ hai câu hỏi về iq và age Giữa biến iq và biến age có tương quan nghịch yếu có ý nghĩa thống kê (p=0,00)
Trang 3graph matrix weight iq age, half jitter(1) msymbol(circle_hollow) msize(small)
Diễn giải kết quả:
Ô đồ thị chấm điểm giữa biến weight và biến iq đi xuống chứng tỏ tương quan nghịch Các chấm điểm rời rạc không thành đường thẳng chứng tỏ hai biến tương quan yếu
Ô đồ thị chấm điểm của biến age và biến weight đi lên chứng tỏ chúng tương quan thuận Tuy nhiên các chấm điểm cũng rời rạc nên chúng ta cũng kết luận rằng chúng tương quan yếu
Ô đồ thị chấm điểm của biến iq và biến age cũng có hình dạng tương tự như giữa biến weight và biến iq
Trang 4Tương quan giữa một biến định lượng và một biến định tính
Trong trường hợp một hoặc hai biến định lượng có phân bố không chuẩn hay một biến là biến định tính, chúng ta không thể sử dụng lệnh corr hay pwcorr để tìm hệ số tương quan mà
chúng ta phải sử dụng lệnh Spearman và lệnh ktau để tính
hệ số tương quan spearman và hệ số tương quan ktau Chúng
ta cũng có thể sử dụng đồ thị để mô tả mối tương quan
bằng lệnh twoway
Cú pháp
twoway (scatter bpt1 bpt2 if
bđl==#, option) (scatter bpt1
bpt2 if bđ;==##, option) ,
options
Các option được sử dụng trong lệnh này:
tượng
của chấm (tròn,
tròn lỗ, dấu x )
trắng )
Ví dụ:
spearman weight life
Number of obs = 105
Spearman's rho = 0.0622
Test of Ho: weight and life are independent
Prob > |t| = 0.5282
ktau weight life
Number of obs = 105
Kendall's tau-a = 0.0359
Kendall's tau-b = 0.0513
Kendall's score = 196
SE of score = 308.818 (corrected for ties)
Test of Ho: weight and life are independent
Prob > |z| = 0.5278 (continuity corrected)
Trang 5Diễn giải kết quả
Kết quả cho thấy mối tương quan Spearman(0.0622) và Kendall(0.0513) giữa hai biến weight và biến life đều rất yếu
Hệ số ktau-b bằng 0,0513 với p=0,5278 chứng tỏ giữa hai biến weight và life không có mối tương quan
twoway (scatter weight age if life==1, msymbol(circle) mcolor(black)
jitter(1)) (sca
> tter weight age if life==2, msymbol(x) mcolor(black) jitter(1)), legend (order(1 "no
> " 2 "yes"))
Diễn giải kết quả
Đồ thị chấm cho thấy ở cả nhóm có ý định tự tự và
không có ý định tự tự có sự tăng trọng nhiều ở nhóm phụ nữ có độ tuổi cao