6. Kết cấu của đề tài
2.1.2.5. Phân tích Crosstab
Định nghĩa:
Cross-Tabulation là một kỹ thuật thống kê mô tả hai hay ba biến cùng lúc và bảng kết quả phản ánh sự kết hợp hai hay ba biến có số lượng hạn chế trong phân tích hoặc trong giá trị khác biệt.
Phân tích Crosstab hai biến:
Bảng phân tích Cross-Tabulation hai biến còn gọi là bảng tiếp liên (contingency table), mỗi ô trong bảng chứa đựng sự kết hợp phân loại của hai biến. Việc phân tích các biến theo cột hay hàng là tùy thuộc vào việc biến đó là biến độc lập hay biến phụ thuộc. Thông thường khi xử lý biến xếp cột là biến độc lập, biến hàng là biến phụ thuộc.
Sau đây là một số kiểm định hay dùng trong phân tích Crosstab:
Chi-square: hay còn gọi là Chi-bình phương, được sử dụng rất phổ biến. Kiểm định Chi-square sẽ cho ta biết có tồn tại mối liên hệ giữa hai biến trong tổng thể hay không. Tuy nhiên, Chi-square không cho biết độ mạnh của mối liên hệ giữa
hai biến. Kiểm định Chi-square được sử dụng phổ biến nhất trong kiểm định mối liên hệ giữa hai biến định tính (định danh – định danh hay định danh – thứ bậc).
Ta sử dụng χ2 (Chi-bình phương) để kiểm định giả thuyết H0 là: “Không có mối liên hệ giữa hai biến” (hay “hai biến độc lập với nhau”). Với thủ thuật dùng giả thuyết H0, ta sẽ cố gắng để chứng minh rằng ta đã sai lầm, sự thật là có tồn tại mối quan hệ giữa các yếu tố, tức là tìm cách để có thể bác bỏ H0.
Trong kiểm định giả thuyết H0, ta có thể sử dụng giá trị p-value. P-value là xác suất phạm sai lầm loại 1 – nghĩa là xác suất loại bỏ giả thuyết H0 với những thông tin tính toán được, như vậy nó có cùng ý nghĩa với mức ý nghĩa α. Xác suất này càng cao cho thấy hậu quả của việc phạm sai lầm khi loại bỏ giả thuyết H0 càng nghiêm trọng (và ngược lại), như vậy quy luật chung là không bác bỏ H0 nếu p- value quá lớn. Như vậy ta chỉ cần xem xét độ lớn của p-value rồi ra quyết định như sau:
Nếu p-value < 0,1 thì kiểm định có ý nghĩa với độ tin cậy 90%(khái niệm “có ý nghĩa” được hiểu là giả thuyết H0 có thể bị bác bỏ với độ tin cậy 90%).
Nếu p-value < 0,05 thì kiểm định có ý nghĩa với độ tin cậy 95%(khái niệm “có ý nghĩa” được hiểu là giả thuyết H0 có thể bị bác bỏ với độ tin cậy 95%). Đây là điều kiện thường được sử dụng.
Nếu p-value < 0,01 thì kiểm định có ý nghĩa với độ tin cậy 90%(khái niệm “có ý nghĩa” được hiểu là giả thuyết H0 có thể bị bác bỏ với độ tin cậy 90%).
Cramer V: được tính dựa trên Chi-bình phương và là một kiểm định trực tiếp mối liên hệ của 2 biến, cho biết độ mạnh của mối liên hệ giữa các biến định danh.