Nếu muốn so sánh hai giá trị trung bình của hai nhóm tổng thể riêng biệt, ta thực hiện phép kiểm định giả thuyết về sự bằng nhau của hai trung bình tổng thể dựa trên hai mẫu độc lập rút ra từ hai tổng thể này (kiểm định t). Trong trường hợp biến phân loại gồm nhiều nhóm, chúng ta vẫn có thể sử dụng được kiểm định t. Tuy nhiên, mỗi lần tiến hành kiểm định giả thuyết về trung bình bằng nhau cho từng cặp như vậy ta chấp nhận một khả năng phạm sai lầm là 5% (hoặc nhiều hơn hay ít hơn tùy độ tin cậy ta mong muốn), như vậy khi làm kiểm định nhiều lần khả năng sai lầm sẽ tăng lên theo số lần làm kiểm định. Trong trường hợp này, phân tích phương sai (Analysis of variance – ANOVA) được sử dụng để tiến hành kiểm định cho tất cả các nhóm mẫu cùng một lúc với khả năng phạm sai lầm chỉ 5%.
Phân tích phương sai (ANOVA) cũng được sử dụng trong trường hợp sự so sánh cho trị trung bình của nhiều nhóm tổng thể độc lập.
Phân tích phương sai (ANOVA) bao gồm phân tích phương sai một yếu tố và phân tích phương sai nhiều yếu tố. Tuy nhiên, ta chỉ xem xét phân tích phương sai một yếu tố (One-Way ANOVA).
Có một số giả định sau đối với phân tích phương sai một yếu tố:
Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên
Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn
Phương sai của các nhóm so sánh phải đồng nhất
Một cách tổng quát, giả sử từ một biến phân loại ta chia tổng thể mẫu thành k nhóm độc lập gồm n1, n2,….,nk quan sát tương ứng trong từng nhóm, n là số quan sát của tổng thể mẫu.
Giả thuyết H0 cần kiểm định là trung bình thực (trung bình tổng thể) – ký hiệu là - của k nhóm này phải bằng nhau:
k
H0 :1 2 ...
(Nghĩa là không có sự khác biệt giữa các trung bình của các nhóm được phân loại theo biến định tính)
47 Bác bỏ H0 nếu : Fk 1,n k, MSW MSG Trong đó:
MSG: phương sai giữa các nhóm MSW: phương sai trong nội bộ nhóm
, , 1n k k
F là giá trị sao cho P(Fk1,nk Fk1,nk,)
Fk-1,n-k có phân phối F với bậc tự do của tử số là (k-1) và bậc tự do của mẫu
số là (n-k).
Nếu kết quả kiểm định dẫn đến việc bác bỏ H0 thì ta phải làm tiếp phân tích sâu (thủ tục Post Hoc) để xác định trung bình của nhóm nào khách với nhóm nào, tức là tìm xem sự khác biệt xảy ra ở đâu, và xác định hướng cũng như độ lớn của khác biệt.
48
CHƯƠNG 4:
PHÂN TÍCH DỮ LIỆU
49
4.1. XÂY DỰNG VÀ LÀM SẠCH DỮ LIỆU :
Dữ liệu sau khi được thu thập được thiết kế, mã hoá và nhập liệu qua công cụ phần mềm SPPS 16, sau đó tiến hành làm sạch. Vì dữ liệu sau khi điều tra thường có những mẫu điều tra bị sai lệch, thiếu sót hoặc là không nhất quán. Do vậy cần phải tiến hành làm sạch dữ liệu để đảm bảo số liệu đưa vào phân tích phải đầy đủ và thống nhất. Theo đó việc phân tích số liệu sẽ giúp ta đưa ra được những thông tin chính xác với độ tin cậy cao hơn.
Phương pháp thực hiện:
Sử dụng bảng tần số để rà soát lại tất cả các biến quan sát nhằm tìm ra các biến thông tin sai lệch hay thiếu sót bằng công cụ phần mềm SPSS.
Lệnh : Analyze – Statistics – Frequencies