Phương pháp kiểm định tương quan giữa các biến tùy thuộc vào thuộc tính (phân loại, liên tục hay rời rạc,…) và tính chất phân phối (chuẩn hay không) của các biến số. Để xem xét tính chất phân phối của biến số (ví dụ biến x), kiểm định Shapiro-Wilk test được sử dụng. Kết quả kiểm định cho biết một biến số tuân theo luật phân phối chuẩn khi trị thống kê p-value > 0.05 (Nguyễn Văn Tuấn 2006).
Đối với 2 biến liên tục: kiểm định Pearson được dùng để kiểm định hệ số tương quan giữa 2 biến liên tục có phân phối chuẩn (Nguyễn Thị Trang và Nguyễn Trương Nam 2012). Theo Nguyễn Văn Tuấn (2006), hệ số tương quan Pearson chỉ hợp lí nếu biến số x và y tuân theo luật phân phối chuẩn. Nếu x và y không tuân theo luật phân phối chuẩn, chúng ta phải sử dụng một hệ số tương quan khác tên là Spearman, một phương pháp phân tích phi tham số. Kết quả thu được từ các phép kiểm định tương quan giữa 2
biến gồm hệ số tương quan r thể hiện chiều hướng quan hệ giữa 2 biến và trị số p-value cho biết tương quan giữa 2 biến có ý nghĩa thống kê hay không.
Đối với 1 biến liên tục (ví dụ biến x) và 1 biến phân loại (ví dụ biến y), để mô tả mối tương quan giữa biến phân loại và biến liên tục, ta sử dụng đồ thị boxplot (Nguyễn Thị Trang và Nguyễn Trương Nam 2012). Sau đó để kiểm tra khẳng định sự khác nhau giữa các giá trị (của biến liên tục) theo biến phân loại cũng như mối liên quan giữa biến phân loại và biến liên tục, theo Nguyễn Văn Tuấn (2006), người ta sử dụng phương pháp kiểm định Wilcoxon hoặc kiểm định Kruskal-Wallis. Các phương pháp kiểm định này không tùy thuộc vào giả định phân phối chuẩn của biến số. Kết quả của các phép kiểm định trên thể hiện qua trị số p-value, nếu p-value < 0.05 thì có thể kết luận rằng độ khác biệt của x theo các phân nhóm của y có ý nghĩa thống kê với độ tin cậy 95%.
Xem xét ảnh hưởng tương tác (Interaction test) của các biến phân loại. Theo Nguyễn Văn Tuấn (2006), hiện tượng ảnh hưởng tương tác xảy ra khi mối liên quan (thể hiện qua hệ số góc Slope) giữa biến Y (biến phụ thuộc) và biến X (biến độc lập) tùy thuộc vào một biến thứ ba, ví dụ biến Z (biến phân loại hoặc biến điều kiện). Để quan sát hiện tượng ảnh hưởng tương tác có xảy ra hay không, người ta sử dụng đồ thị phân tán (Scatter plot) để xem xét về sự phân bố điểm giữa các nhóm (theo biến phân loại Z) có khác nhau hay không, đồng thời quan sát xem có sự khác biệt về hệ số góc giữa các đường ước lượng hồi quy theo các nhóm trong đồ thị hay không. Nếu những điều trên thỏa mãn thì có khả năng xảy ra hiện tượng ảnh hưởng tương tác. Đó là cơ sở để đưa các biến tương tác vào mô hình hồi quy.
Xác định tầm ảnh hưởng của các biến: Để đánh giá tầm quan trọng của các biến độc lập đến biến phụ thuộc, có 1 chỉ số rất tốt và hiệu quả giúp thực hiện được điều này, đó là chỉ số LMG được 3 nhà thống kê học đề xuất là Linderman, Merenda và Gold (Nguyễn Văn Tuấn 2006). Chỉ số này được tính theo phương pháp bootstrap (lấy mẫu có hoàn lại) để ước tính mức độ “giải thích” của từng biến độc lập trong quan hệ với biến
phụ thuộc. Biến số nào có chỉ số LMG càng cao thì mức độ ảnh hưởng của biến đó đến biến phụ thuộc càng lớn. Việc xem xét chỉ số LMG sẽ giúp nhận biết tầm quan trọng của từng biến số trong mối tương quan với biến phụ thuộc của đề tài nghiên cứu.