a) Định nghĩa:
Kỹ thuật phân tích phương sai là kỹ thuật dùng để kiểm định giả thiết về các
tổng thể nhóm có giá trị trung bình bằng nhau. Kỹ thuật này dựa trên cơ sở sự biến
thiên trong nội bộ các nhóm và sự biến thiên giữa trung bình nhóm. Từ đó, ta có thể
rút ra kết luận về mức độ khác nhau giữa các trung bình nhóm.
b) Phương pháp phân tích
Giả thiết H0: trung bình thực của k nhóm này bằng nhau.
Ta tính toán các đại lượng kiểm định như sau:
Tổng các độ lệch bình phương trong nội bộ nhóm: phản ánh biến thiên ngẫu
nhiên do ảnh hưởng của các yếu tố khác.
SSW = 2 1 1 ) ( k i n j i ij j x x
định lượng đang nghiên cứu do tác động của biến phân loại đang xem xét. SSG = 2 1 ) ( k i i x x
Tổng độ lệch bình phương toàn bộ: phản ảnh toàn bộ biến thiên của biến định lượng đang nghiên cứu xem xét.
SST = i n j ij k i x x 1 2 1 ) (
Các độ lệch bình phương bình quân hay còn gọi là độ lệch quân phương được xác định như sau:
1. Phương sai trong nội bộ nhóm
MSW =
k n SSW
2. Phương sai giữa các nhóm
MSG =
1
k SGG
Nguyên tắc quyết định với mức ý nghĩa là bác bỏ H0 nếu
MSW MGS
> Fk-1,n-k,a
Để tìm ra sự khác biệt xảy ra ở đâu và để xác định về độ lớn của sự khác biệt
bằng các kiểm định sau có nghĩa là ta thực hiện kiểm định sự khác nhau của trung
bình nhóm sau khi đã thực hiện phân tích Anova.
Một số phép kiểm định thống kê để so sánh giá trị trung bình giữa các nhóm:
- Bonferroni: tiến hành giống như LDS (so sánh từng cặp) nhưng điều chỉnh
mức ý nghĩa khi tiến hành so sánh bội dựa trên số lần tiến hành so sánh. Nó là một
trong những thủ tục kiểm định đơn giản nhất và hay được sử dụng cho mục tiêu này. - Dunnett: là thủ tục cho phép so sánh các giá trị trung bình của các nhóm mẫu
còn lại với giá trị trung bình của một nhóm mẫu cụ thể nào đó được chọn ra để so sánh.
1.4..2.3.4. Phân tích hồi quy
a) Định nghĩa:
Phân tích hồi quy là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc
thích) với ý tưởng cơ bản là ước lượng hay dự đoán giá trị trung bình của biến phụ
thuộc trên cơ sở đã biết của biến độc lập.
b) Các giả định khi xây dựng mô hình hồi quy
Mô hình hồi quy có dạng:
Yi = B0+ B1 X1i+ B2 X2 i+…+ Bn Xn i + ei
Các giả định quan trọng khi phân tích hồi quy tuyến tính
- Giả thiết 1: giả định liên hệ tuyến tính.
- Giả thiết 2: phương sai có điều kiện không đổi của các phần dư.
- Giả thiết 3: không có sự tương quan giữa các phần dư.
- Giả thiết 4: không xảy ra hiện tượng đa cộng tuyến.
- Giả thiết 5: giả thiết về phân phối chuẩn của phần dư.
c) Xây dựng mô hình hồi quy Các bước xây dựng mô hình:
B1. Xem xét ma trận hệ số tương quan
Để xem xét mối quan hệ giữa biến phụ thuộc và các biến độc lập thông qua
xây dựng ma trận tương quan. Đồng thời ma trận tương quan là công cụ xem xét mối
quan hệ giữa các biến độc lập với nhau nếu các biến này có tương quan chặt thì nguy
cơ xảy ra hiện tượng đa cộng tuyến cao dẫn đến việc vi phạm giả định của mô hình.
B2. Đánh giá độ phù hợp của mô hình
Thông qua hệ số R2 ta đánh giá độ phù hợp của mô hình xem mô hình trên giải thích bao nhiêu % sự biến thiên của biến phụ thuộc.
R2 =
TSS ESS
ESS: tổng bình phương tất cả các sai lệch giữa giá trị dự đoán của Yi và giá trị trung bình của chúng.
TSS: tổng bình phương sai lệch giữa giá trị Yi và giá trị trung bình của
chúng.
Khi đưa càng nhiều biến vào mô hình thì hệ số này càng cao. Tuy nhiên, R2ở
quy đơn. Lức này, ta phải sử dụng R2 điều chỉnh để đánh giá sự phù hợp của mô hình. 2 R = 1- (1 - R2 ) k n n 1
B3.Kiểm định sự phù hợp của mô hình
Sử dụng kiểm định F để kiểm định với giả thiết Ho: B1 = B2 = Bn = 0
Nếu giả thiết này bị bác bỏ thì ta có thể kết luận mô hình ta xây dựng phù hợp với tập dữ liệu.
B4: Xác định tầm quan trọng của các biến
Ý tưởng đánh giá tầm quan trọng tương đối của các biến độc lập trong mô
hình thông qua xem xét mức độ tăng của R2 khi một biến giải thích được đưa thêm
vào mô hình. Nếu mức độ thay đổi này mà lớn thì chứng tỏ biến này cung cấp thông tin độc nhất về sự phụ thuộc mà các biến khác trong phương trình không có được. Ta đánh giá tầm quan trọng của một biến thông qua hai hệ số:
Hệ số tương quan từng phần: căn bậc hai của R2 change. Thể hiện mối tương
quan giữa biến Y và X mới đưa vào. Tuy nhiên, sự thay đổi của R2 không thể hiện tỉ
lệ phần biến thiên mà một mình biến đó có thể giải thích. Lúc này, ta sử dụng hệ số tương quan riêng bằng căn bậc hai của Prk2, Prk2=
k 2 k 2 R 1 R R 2 .
B5. Lựa chọn biến cho mô hình
Đưa nhiều biến độc lập vào mô hình hồi quy không phải lúc nào cũng tốt vì những lý do sau (trừ khi chúng có tương quan chặt với biến phụ thuộc):
- Mức độ tăng R2 quan sát không hẳn phản ảnh mô hình hồi quy càng phù hợp hơn với tổng thể.
- Đưa vào các biến không thích đáng sẽ làm tăng sai số chuẩn của tất cả các ước lượng mà không cải thiện được khả năng dự đoán.
- Mô hình nhiều biến thì khó giải thích và khó hiểu hơn mô hình ít biến.
Ta sử dụng SPSS để giải quyết vấn đề trên. Các thủ tục chọn biến trên SPSS:
kết hợp của hai phương pháp loại trừ dần và đưa vào dần).
B6. Dò tìm sự vi phạm các giả các giả thiết (đã nêu ở trên bằng các xử lý của
SPSS).
Ngoài ra, còn sử dụng phân tích chi bình phương một mẫu để tìm ra quy luật
phân phối của mẫu và đánh giá độ tin cậy của thang đo thông qua hệ số Crobach
alpha.