VI. Bố cục của nghiên cứu
3.3.1 Các tham số thống kê trong phân tích biệt số:
-Canonical correlation: hệ số tương quan canonical đo lường mức độ liên hệ giữa các biệt số và các nhóm. Nó là một thước đo mối liên hệ giữa hàm phân biệt đơn và tập hợp các biến giả xác định các nhóm.
-Centroid: là trung bình của các giá trị biệt số trong mỗi nhóm, số centroid bằng với số nhóm vì mỗi nhóm có một centroid.
-Classification matrix: ma trận phân loại (ma trận dự đoán) chứa số quan sát phân loại đúng và số quan sát phân loại sai. Số quan sát phân loại đúng sẽ nằm trên đường chéo của ma trận, và số quan sát phân loại sai nằm ngoài đường chéo. Tổng của các số nằm trên đường chéo được chia cho tổng số quan sát và được gọi là tỉ lệ đúng (tỉ lệ thành công).
-Discriminant function coefficients: các hệ số hàm phân biệt (chưa chuẩn hóa) là các quyền số (trọng số) của các biến khi các biến được đo lường bằng đơn vị tính nguyên thủy.
-Discriminant scores: các biệt số được tính bằng cách nhân các hệ số không chuẩn hóa được với giá trị của các biến, sau đó lấy tổng của các tích tìm được theo phương trình ở phần trên.
-Eigenvalue: đối với mỗi hàm phân biệt thì eigenvalue là tỉ số giữa tổng các độ lệch bình phương giữa các nhóm và tổng các độ lệch bình phương trong nội bộ nhóm (SSG/SSW). Eigenvalue càng lớn thì hàm phân biệt càng tốt.
biến phân loại được sử dụng như biến độc lập, và mỗi biến dự đoán được sử dụng như biến phụ thuộc kiểu định lượng.
-Group means and group standard deviations: trung bình nhóm và độ lệch chuẩn nhóm được tính cho mỗi biến dự đoán cho mỗi nhóm.
-Pooled within-group correlation matric: ma trận tương quan nội bộ nhóm chung được tính bằng cách lấy trung bình các ma trận hiệp phương sai riêng cho tất cả các nhóm.
-Standardized discriminant funtion coefficients: các hệ số hàm phân biệt chuẩn hóa là các hệ số hàm phân biệt được sử dụng như quyền số khi các biến được chuẩn hóa có trung bình là 0 và phương sai là 1.
-Structure correlation (discriminant loadings): tương quan kết cấu (hệ số biệt tải) cho biết các hệ số tương quan đơn giữa các biến và hàm phân biệt.
-Total correlation matric: ma trận tương quan toàn bộ là ma trận tương quan khi các quan sát được coi như xuất phát từ một mẫu duy nhất.
-Wilks’λ đôi khi được gọi là đại lượng thống kê U (U statistic), Wilks’λđối với mỗi biến dự đoán là tỷ số giữa các độ lệch bình phương trong nội bộ các nhóm và tổng các độ lệch bình phương toàn bộ. Giá trị của nó trong khoảng từ 0 đến 1. λ lớn (gần 1) cho biết các trung bình nhóm dường như không khác nhau. λ nhỏ (gần 0) cho biết các trung bình nhóm dường như giống nhau.
Các giả định trong phân tích biệt số là: mỗi nhóm là một mẫu của một tổng thể có phân phối chuẩn đa biến và các tổng thể này có ma trận hiệp phương sai giống nhau (các phương sai bằng nhau).