MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH • Kiểm định mối liên hệ giữa hai biến định danh hoặc định danh – thứ bậc – Giả thuyết • Ho: Không tồn tại mối liên hệ giữa hai biến • H1: Hai biến c
Trang 1PHÂN TÍCH DỮ LIỆU NGHIÊN
CỨU VỚI SPSS
TIN HỌC ỨNG DỤNG
Trang 2• Hiểu và áp dụng được các phương pháp phân tích
dữ liệu phù hợp với yêu cầu nghiên cứu
• Tổ chức và làm việc nhóm phân tích dữ liệu
nghiên cứu; làm báo cáo và trình bày kết quả nghiên cứu
Trang 3• Phân tích phương sai
• Tương quan tuyến tính
• Hồi quy tuyến tính
Trang 4MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH
• Kiểm định mối liên hệ giữa hai biến định danh hoặc định danh – thứ bậc
• Kiểm định mối liên hệ giữa hai biến thứ bậc
Trang 5MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH
• Lý thuyết Chi-bình phương
– Bước 1: Đặt giả thuyết Ho: “Không có mối liên hệ giữa hai biến” hay “Hai biến độc lập với nhau”
– Bước 2: Thực hiện kiểm định 2
– Bước 3: So sánh giá trị p-value với giá trị
• Chấp nhận Ho nếu p-value >
• Bác bỏ Ho nếu p-value
– P-value là xác suất phạm sai lầm khi loại bỏ giả thuyết Ho, xác suất này càng cao thì hậu quả của việc phạm sai lầm khi loại bỏ giả thuyết Ho càng
Trang 6MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH
• Kiểm định mối liên hệ giữa hai biến định danh hoặc định danh – thứ bậc
– Giả thuyết
• Ho: Không tồn tại mối liên hệ giữa hai biến
• H1: Hai biến có liên hệ với nhau
Trang 10MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH DANH
Các đại lượng kiểm
định dành cho hai
biến định danh
Các đại lượng kiểm định dành cho hai biến thứ bậc
Trang 13MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH
• Kiểm định mối liên hệ giữa hai biến thứ bậc
– Giả thuyết
• Ho: Không tồn tại mối liên hệ giữa hai biến
• H1: Hai biến có liên hệ với nhau
– Phương pháp
• Sử dụng kiểm định tau-b của Kendall, kiểm định d của Some, kiểm định gamma của Goodman và Kruskal với mức ý nghĩa
Trang 16≠
Trang 17• So sánh trị trung bình của hai nhóm tổng thể riêng
• So sánh trị trung bình của hai nhóm tổng thể riêng biệt có đặc điểm các phần tử của hai nhóm có sự tương đồng từng đôi một
• So sánh trị trung bình của nhiều nhóm tổng thể độc
Trang 25PHÂN TÍCH TRẮC NGHIỆM GIẢ THIẾT
• Mục tiêu của trắc nghiệm giả thiết là nhằm quyết định tính chính xác của giả thiết dựa trên các số liệu mẫu thu thập được Chúng ta đánh giá tính chính xác của các giả thiết bằng cách áp dụng các kỹ thuật thống kê; và đánh giá tầm quan trọng của sự khác biệt có ý nghĩa thống kê
• Cách tiếp cận cổ điển hay là lý thuyết lấy mẫu thể hiện cách nhìn mục tiêu theo xác suất dựa trên phân tích dữ liệu mẫu Một giả thiết được xây dựng, nó sẽ bị bác bỏ hoặc chấp nhận dựa trên mẫu dữ liệu thu thập
Trang 27KIỂM ĐỊNH TRỊ TRUNG BÌNH CỦA HAI TỔNG THỂ
• Kiểm định trị trung bình của hai tổng thể - trường hợp mẫu độc lập
• Kiểm định trị trung bình của hai mẫu phụ thuộc hoặc phối hợp từng cặp
Trang 30Sig < 5% => phương sai hai mẫu
khác nhau => sử dụng “Equal
variances not assumed”
Sig > 5% => phương sai hai mẫu
bằng nhau => sử dụng “Equal
variances assumed”
GIẢ THUYẾT H 0 : Tuổi trung bình giữa nam và nữ là bằng nhau
Trang 31Kết quả kiểm định sự bằng nhau
về trị trung bình của hai mẫu
Sig > 5% => phương sai hai mẫu
bằng nhau => sử dụng “Equal
variances assumed”
Sig < 5% => Bác bỏ giả thuyết H0
GIẢ THUYẾT H 0 : Tuổi trung bình giữa nam và nữ là bằng nhau
Trang 32• Nếu Sig ≥ 0.05 thì phương sai của 2 tổng thể không khác nhau, ta sử dụng kết quả kiểm định t ở dòng Equal variances assumed
Trang 33• Nếu Sig của kiểm định t ≤ α (mức ý nghĩa) có sự phác biệt có ý nghĩa về trung bình của 2 tổng thể
• Nếu Sig > α (mức ý nghĩa) không có sự khác biệt có ý nghĩa về trung bình của 2 tổng thể
Trang 34KIỂM ĐỊNH TRỊ TRUNG BÌNH CỦA HAI TỔNG THỂ -
TRƯỜNG HỢP MẪU PHỐI HỢP TỪNG CẶP
• Nguyên lý
– Dữ liệu ở dạng thang đo khoảng cách hoặc tỷ lệ
– Tính toán chênh lệch trên từng cặp quan sát
– Kiểm định giả thuyết H0 “chênh lệch trung bình của tổng thể bằng 0”
• Ví dụ
– Cảm nhận của khách hàng trước và sau khi Ngân hàng triển khai Cam kết chất lượng dịch vụ (SLAs)
Trang 35KIỂM ĐỊNH TRỊ TRUNG BÌNH CỦA HAI TỔNG THỂ -
TRƯỜNG HỢP MẪU PHỐI HỢP TỪNG CẶP
• Quy trình thực hiện
– Gọi chức năng Analye > Compare Means > Samples T Test
Paired-– Cung cấp cặp biến phối hợp
– Điều chỉnh độ tin cậy (nếu cần)
Trang 36KIỂM ĐỊNH TRỊ TRUNG BÌNH CỦA HAI TỔNG THỂ -
TRƯỜNG HỢP MẪU PHỐI HỢP TỪNG CẶP
Trang 37KIỂM ĐỊNH TRỊ TRUNG BÌNH CỦA HAI TỔNG THỂ -
TRƯỜNG HỢP MẪU PHỐI HỢP TỪNG CẶP
GIẢ THUYẾT H 0 : Cảm nhận của khách hàng là không đổi
Sig < 5% => Bác bỏ giả thuyết H0
Trang 38– Mở rộng kiểm định t – kiểm định nhiều nhóm mẫu cùng một lúc
– Các nhóm mẫu phải có cùng phương sai
• Phân loại
– ANOVA một yếu tố (một biến phân loại)
– ANOVA nhiều yếu tố (nhiều biến phân loại)
Trang 39– Cung cấp biến phụ thuộc, biến phân loại
– Thiết lập các tính toán thống kê mô tả, kiểm định sự bằng nhau của các nhóm
Trang 41PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
GIẢ THUYẾT H 0 : Không có sự khác nhau về thanh toán bằng thẻ
Kiểm tra điều kiện áp dụng ANOVA: phương sai bằng nhau
giữa các nhóm mẫu Sig > 0.05 => phủ định H
0 => phương sai bằng nhau
Sig > 5% => Chấp nhận giả
thuyết H0
Trang 42PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
• Phân tích sâu ANOVA
– Kiểm định trước (Contrasts)
• Kiểm định các giả định về trung bình nhóm trước khi phân tích ANOVA
– Kiểm định sau (Post Hoc)
• Kiểm định các giả định về trung bình nhóm sau khi phân tích ANOVA
Trang 43PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
Thực hiện kiểm định t cho từng
cặp trung bình nhóm
Giống LSD, tiến hành so sánh bội trên số lần tiến hành so sánh
Sử dụng bảng phân phối Studentizze range distribution
Kiểm định lại toàn bộ các trị trung bình
nhóm Nếu không bằng nhau thì kiểm
Trang 44PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
Trị trung bình của 4 nhóm đầu bằng với nhóm cuối cùng
Trang 46PHÂN TÍCH PHƯƠNG SAI HAI YẾU TỐ
Giả định phương sai các nhóm bằng nhau không bị vi phạm => kiểm định ANOVA có ý nghĩa
Chấp nhận giả thuyết H0
GIẢ THUYẾT H 0 : Không có sự khác nhau về thanh toán bằng thẻ
KẾT LUẬN: Không có sự khác nhau về thanh toán bằng thẻ
Trang 48TƯƠNG QUAN TUYẾN TÍNH
• Hệ số tương quan đơn (r)
– Tên đầy đủ Pearson Correlation Coefficient
– Áp dụng trong trường hợp tổng thể có phân phối chuẩn
– Lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lượng
– Mối liên hệ giữa hai biến có thể
Trang 49– Gọi chức năng Analyze > Correlate > Bivariate
– Lựa chọn hai hay nhiều biến định lượng để phân tích
– Lựa chọn một (số) hệ số tính toán
– Lựa chọn loại kiểm định mức ý nghĩa
• Ví dụ
Trang 52TƯƠNG QUAN TUYẾN TÍNH
Hệ số tương quan giữa hai biến là 0.67 ở mức ý nghĩa nhỏ hơn 1%
Trang 53TƯƠNG QUAN TUYẾN TÍNH
• Hệ số tương quan hạng Spearman
– Tên đầy đủ Rank Correlation Coefficient
– Áp dụng trong trường hợp tổng thể không có phân phối chuẩn
Trang 54HỒI QUY TUYẾN TÍNH
• Khái niệm và ý nghĩa của Hồi qui
• Xây dựng mô hình hồi qui
• Kiểm định mô hình (giả thiết về sự phụ thuộc)
Trang 55– Thu nhập và tiêu dùng
– Các yếu tố đầu vào và kết quả của quá trình sản xuất
Trang 56– Hồi quy tuyến tính đơn
– Hồi quy tuyến tính bội
• Ví dụ
– Tác động của kết quả tuyển sinh đầu vào đối với điểm trung bình học tập toàn khóa của sinh viên
Trang 58– X i là giá trị quan sát thứ i của biến độc lập
– là giá trị dự đoán thứ icủa biến phụ thuộc
– Bo và B1 là hệ số hồi quy; phương pháp bình phương nhỏ nhất (OLS) xác định hai hệ số này
= + ∗
Trang 61– Giả sử chúng ta có một mẫu gồm n cặp quan sát (Yi,Xi), i = 1÷ n Theo phương pháp bình phương nhỏ nhất, ta phải tìm Y^ sao cho nó càng gần với giá trị
Trang 62– Giả sử chúng ta có một mẫu gồm n cặp quan sát (Yi,Xi),
i = 1÷ n Theo phương pháp bình phương nhỏ nhất, ta phải tìm Y^ sao cho nó càng gần với giá trị thực (Yi) càng tốt, tức phần dư:
– ei = Yi – Yi^ = Yi – B0 - B1 *Xi càng nhỏ càng tốt
– Do ei ( i=1,n ) có thể dương, có thể âm, nên ta cần tìm SRF sao cho tổng bình phương của các phần dư đạt cực tiểu
Trang 63– Các giá trị của Y độc lập với nhau
– Các giá trị trung bình nằm trên một đường thẳng
– Phần dư
• Quy trình thực hiện
– Gọi thực hiện Analyze > Regression > Linear …
= − = − ( + ∗ )
Trang 65HỒI QUY TUYẾN TÍNH ĐƠN
Đo lường mức độ phù hợp của mô
hình đối với mẫu
Kiểm định mức độ phù hợp của
mô hình đối với tổng thể (F lớn,
Sig < 0.05)
Kiểm định ý nghĩa của các hệ số
hồi quy (Sig < 0.05)
Hệ số hồi quy
Trang 66– Cho biết mức độ (%) sự biến thiên của biến phụ thuộc
được giải thích bởi biến độc lập
– Giá trị của Sig( P-value) của bảng ANOVA dùng để đánh giá sự phù hợp (tồn tại) của mô hình Giá trị Sig nhỏ (thường <5%) thì mô hình tồn tại
Trang 67ĐO LƯỜNG MỨC ĐỘ PHÙ HỢP CỦA MÔ HÌNH
• Để có thể biết mô hình giải thích được như thế nào hay % biến động của biến phụ thuộc, người ta sử dụng R2 (0 ≤ R2 ≤ 1)
Trang 68HỒI QUY TUYẾN TÍNH ĐƠN
• Kiểm tra các giả định
– Giả định liên hệ tuyến tính
– Giả định Các sai số ngẫu nhiên trong hàm hồi qui tổng thể có phương sai của sai số không đổi
– Giả định về phân phối chuẩn của phần dư
– Giả định về tính độc lập của sai số
Trang 70PHƯƠNG SAI CỦA SAI SỐ KHÔNG ĐỔI
GIẢ THUYẾT H 0 : Phương sai của sai số không đổi
GIẢ THUYẾT H 0 : Hệ số tương quan hạng Spearman cho hai biến
Input_Score và ABSres bằng 0
Sig < 0.05 => Bác bỏ giả thuyết H0
=> Phương sai của sai số thay đổi
KẾT LUẬN: Mô hình hồi quy tuyến tính không có giá trị
Trang 72(quá nhỏ hoặc quá lớn)
Giả thuyết: Hệ số tương quan tổng thể của sai số bằng 0
Trang 73Chấp nhận giả thuyết không có tự tương quan chuỗi bậc nhất
Không có kết luận
Có tự tương quan nghịch
(âm)
Trang 74– X ki là giá trị quan sát thứ i của biến độc lập thứ k
– là giá trị dự đoán thứ i của biến phụ thuộc
– i là các hệ số hồi quy riêng phần
– Phần dư e i là biến độc lập ngẫu nhiên N(0,2 )
Trang 76– Đánh giá độ phù hợp của mô hình
– Kiểm định độ phù hợp của mô hình
– Giải thích các hệ số hồi quy riêng trong mô hình
– Xác định tầm quan trọng của các biến trong mô hình – Lựa chọn biến cho mô hình
– Dò tìm các vi phạm giả định cần thiết
Trang 77XEM XÉT MA TRẬN HỆ SỐ TƯƠNG QUAN
Hệ số tương quan giữa hai biến độc lập thấp
Hệ số tương quan giữa
biến phụ thuộc với các
biến độc lập tương đối cao
Trang 79KIỂM ĐỊNH CÁC GIẢ THUYẾT
Mô hình giải thích được 71% các trường hợp được ghi nhận => độ phù hợp CAO
Sig < 0.01 chứng tỏ các hệ số hồi quy không đồng nhất 0, mô hình
có thể sử dụng được
Trang 80TẦM QUAN TRỌNG CỦA CÁC BIẾN
Hai biến này có ảnh hưởng đối với mô hình lớn hơn các
biến còn lại
Trang 84– Giả định liên hệ tuyến tính
– Giả định phương sai của sai số không đổi
– Giả định về phân phối chuẩn của phần dư
– Giả định về tính độc lập của sai số
– Giả định về hiện tượng đa cộng tuyến
Trang 86PHƯƠNG SAI CỦA SAI SỐ KHÔNG ĐỔI
KẾT LUẬN: Phương sai của sai số không đổi
Chấp nhận giả thuyết H0
GIẢ THUYẾT H 0 : Phương sai của sai số không đổi
Trang 89Chấp nhận giả thuyết không có tự tương quan chuỗi bậc nhất
Không có kết luận
Có tự tương quan nghịch
(âm)
Trang 90HIỆN TƯỢNG ĐA CỘNG TUYẾN
KẾT LUẬN: Không xảy ra hiện tượng đa cộng tuyến
Trang 91• Phân tích phương sai
• Tương quan tuyến tính
• Hồi quy tuyến tính