# Phân tích tương quan - 2 biến định lượng - Mối liên quan giữa hai biến định lượng có thể được biểu thị dưới dạng biểu đồ chấm và hệ số tương quan - Nếu cả hai biến đều có phân bố chuẩ
Trang 1PHÂN TÍCH DỮ LIỆU
KIỂM ĐỊNH GIẢ THUYẾT,
HỒI QUY
Trang 2# Phân tích tương quan - 2
biến định lượng
- Mối liên quan giữa hai biến định lượng có thể
được biểu thị dưới dạng biểu đồ chấm và hệ số tương quan
- Nếu cả hai biến đều có phân bố chuẩn, thì hệ số tương quan Pearson’s là có giá trị
- Nếu không, cần phải sử dụng hệ số tương quan Spearman’s
- Từ thực đơn dọc chọn:
Analyse/Correlate/Bivariate
Trang 3# Hệ số tương quan
Trang 4Kiểm định trung bình tổng thể
# Kiểm định giả thuyết về trung bình
của một tổng thể:
Nếu muốn so sánh giá trị trung bình của
một tổng thể với một giá trị cụ thể nào đó,
sử dụng One-sample T-test
- Vào menu, chọn Analyze/Compare
Means/ One-sample T-test
- Chọn biến đưa vào khung Test Variable
- Khai báo Test Value
Trang 5# Ví dụ: Kiểm định One-sample
T-test
Trang 7- Vào menu, chọn Analyze/Compare
Means/ Independent-Samples T-test
Trang 10Independent-samples T-test
- Điều kiện áp dụng:
2 mẫu phải được chọn ngẫu nhiên, có phân phối chuẩn hoặc xấp xỉ phân phối chuẩn; không có các giá trị bất thường (outliers)
Trang 11- Ví dụ
Trang 12samples T-test
- Vào menu, chọn Analyze/Compare
Means/ Paired-Samples T-test
Trang 14phương sai ANOVA
- Phân tích phương sai 1 yếu tố (One-way
ANOVA): trường hợp sử dụng 1 biến yếu tố
để phân loại các quan sát thành các nhóm
khác nhau
Trang 15Phân tích phương sai một yếu
+ Phương sai của các nhóm so sánh phải đồng nhất (bằng nhau)
Trang 17- Ví dụ
Trang 18- Phân tích sâu ANOVA
Trang 19Kiểm định tỷ lệ tổng thể
- Sử dụng Chi-bình phương
hoặc/và Binomial Test
- Điều kiện:
+ Mẫu được chọn ngẫu nhiên
+ Biến nhị phân (chỉ có 2 tình huống) Nếu
có nhiều hơn, nên dùng lệnh Recode đểchuyển thành biến có 2 lựa chọn
Trang 21- Ví dụ
Trang 22Hồi quy tuyến tính
- Dùng để suy rộng cho mối quan hệ giữa các biến trong tổng thể
- Dùng để dự báo được mức độ của biến phụ thuộc (Y) (với độ chính xác trong
một phạm vi giới hạn) khi biết trước giá trị của biến độc lập (X)
Trang 23Hồi quy đơn tuyến tính
• Mô hình xây dựng từ dữ liệu mẫu có
dạng: Y = Bo + B1 * X
Trong đó:
X: biến độc lập
Y: biến phụ thuộc
Bo & B1: Hệ số hồi quy
- Ví dụ: Doanh số = Bo + B1* Chi phí chào
hàng
Trang 24Hồi quy đơn tuyến tính
• Cách xây dựng trong SPSS:
- Vào menu, chọn Analyze/ Regression/Linear
- Chọn biến phụ thuộc, đưa vào ô Dependent
- Chọn biến độc lập, đưa vào ô Independents
- Bấm OK
Trang 25Ví dụ
Trang 26Đánh giá độ phù hợp của mô
hình
• Để biết mô hình hồi quy tuyến tính đã xây dựng trên dữ liệu mẫu phù hợp đến mức độ nào với dữ liệu: sử dụng hệ số xác định R2
• Hệ số này càng gần 1: mô hình càng
thích hợp; càng gần 0: mô hình càng
kém phù hợp với tập dữ liệu mẫu
Trang 27Đánh giá độ phù hợp của mô
hình
• Hệ số xác định R2 còn đo lường mối
tương quan giữa X và Y
• Ví dụ: R2 = 0,818: mô hình hồi quy
tuyến tính đã xây dựng phù hợp với tập
dữ liệu đến mức 81,8% Hay 81,8%
khác biệt của các giá trị Y quan sát
được có thể được giải thích bởi sự khác biệt giữa các giá trị X
Trang 28Kiểm định giả thuyết
• Để kiểm định độ phù hợp của mô hình hồi quy tổng thể, sử dụng đại lượng F từ bảng phân tích phương sai ANOVA
• Giả thuyết Ho:
Hệ số R2 của tổng thể = 0
Đọc kết quả: nếu p < mức ý nghĩa: bác bỏ
Ho và kết luận mô hình hồi quy tuyến tính xây dựng phù hợp với tổng thể
Trang 29Kiểm định giả thuyết
• Để kiểm định ý nghĩa của hệ số hồi
quy:
• Ho: độ dốc của mô hình tổng thể B1 =0
• Cách đọc kết quả: sử dụng giá trị
p-value (Sig.) của kiểm định t
• Nếu p-value < mức ý nghĩa: bác bỏ Ho, kết luận giữa hai biến trong tổng thể có liên hệ tuyến tính
Trang 30Ví dụ
Trang 31Các giả định cần tuân thủ
• Các giá trị quan sát của X & Y có liên hệ tuyến tính
• Phương sai của sai số không đổi
• Phần dư phân phối chuẩn
• Tính độc lập của sai số (không có tương quan giữa các phần dư)