Phân tích hồi quy đa biến

3.4.4.1. Phân tích tương quan hệ số Pearson

Hệ số tương quan Pearson (Pearson correlation coefficient, kí hiệu r) đo lường mức độ tương quan tuyến tính giữa hai biến. Kiểm định hệ số tương quan Pearson dùng để kiểm tra mối liên hệ tuyến tính giữa các biến độc lập và biến phụ thuộc. Nếu các biến độc lập với nhau có tương quan chặt thì phải lưu ý đến vấn đề đa cộng tuyến khi phân tích hồi quy (giả thuyết H0: hệ số tương quan bằng 0). Hệ số tương quan Pearson (r) sẽ nhận giá trị từ -1 đến +1. Điều kiện để tương quan có ý nghĩa là giá trị Sig. < 0.05

• r < 0 cho biết một sự tương quan nghịch giữa hai biến, nghĩa là nếu giá trị của biến này tăng thì sẽ làm giảm giá trị của biến kia.

• r = 0 cho thấy không có sự tương quan.

• r > 0 cho biết một sự tương quan thuận giữa hai biến, nghĩa là nếu giá trị của biến này tăng thì sẽ làm tăng giá trị của biến kia.

3.4.4.2. Kiểm định sự phù hợp của mô hình

Sau khi kết luận được các biến có mối quan hệ tuyến tính thì có thể mô hình hoá mối quan hệ nhân quả này bằng hồi quy tuyến tính (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2007). Nghiên cứu thực hiện hồi quy đa biến theo phương pháp Enter: tất cả các biến được đưa vào một lần và xem xét các kết quả thống kê liên quan. Đánh giá mức độ phù hợp của mô hình hồi quy đa biến thông qua R2 và R2 hiệu chỉnh, kiểm định ANOVA.

Hệ số R2 (R Square) và R2 hiệu chỉnh. Hai giá trị này dùng đo sự phù hợp của mô hình hồi quy, còn gọi là hệ số xác định (coefficient of determination) nghĩa là các biến (nhân tố) độc lập giải thích được bao nhiêu phần trăm (%) biến thiên của biến phụ thuộc. Giá trị R2 dao động từ 0 đến 1. R2 càng gần 1 thì mô hình đã xây dựng càng phù hợp với bộ dữ liệu dùng chạy hồi quy. R2 càng gần 0 thì mô hình đã xây dựng càng kém phù hợp với bộ dữ liệu dùng chạy hồi quy. Thông thường, R2 > 50% mô hình phù hợp.

Kiểm định ANOVA được sử dụng để kiểm định mức độ phù hợp của mô hình tương quan, tức là có hay không có mối quan hệ giữa các biến độc lập hay biến phụ thuộc. Thực chất của kiểm định ANOVA đó là kiểm định xem biến phụ thuộc có liên hệ tuyến tính với toàn bộ tập hợp các biến độc lập hay không, và giả thuyết H0 được đưa ra là Hệ số xác định R = 0. Giá trị Sig. nhỏ hơn mức ý nghĩa kiểm định (thường < 5%) sẽ giúp khẳng định sự phù hợp của mô hình hồi quy (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2007).

3.4.4.3. Kiểm tra sự vi pphạm các giả định của mô hình

Mô hình tuyến tính được thực hiện bằng phương pháp ước lượng tổng bình phương nhỏ nhất (OLS) với một số giả định và mô hình chỉ thực sự có ý nghĩa khi các giả định này được đảm bảo. Do vậy để đảm bảo độ tin cậy của mô hình, cần dò tìm sự vị phạm các giả định cần thiết.

Kiểm định hiện tượng liên hệ tuyến tính giữa các biến thông qua biểu đồ phân tán Scatterplot. Ta cần chú ý đến phần dư chuẩn hoá (Regression Standardized Residual) và giá trị dự đoán chuẩn hoá (Regression Standardized Predicted Value).

Kiểm định phân phối chuẩn phần dư thông qua đồ thị Histogram về mặt lí thuyết phân phối chuẩn là phân phối có trung bình bằng 0, phương sai bằng 1. Kiểm định phương sai sai số thay đổi: đây là hiện tượng phương sai của các số hạng không giống nhau kiểm định thông qua phương pháp Spearman

Kiểm định hiện tượng tự tương quan: đây là một dạng vi phạm các giả thuyết cơ bản số hạng nhiễu, thông qua Durbin - Watson để kiểm tra tương quan chuỗi bậc nhất.

Kiểm định hiện tượng đa cộng tuyến: Đa cộng tuyến là một hiện tượng trong có các biến độc lập có tương quan chặt chẽ với nhau. Vấn đề của hiện tượng đa cộng tuyến là chúng cung cấp cho mô hình những thông tin giống nhau và rất khó tách ảnh hưởng của từng biến một. Thông qua hệ số phóng đại phương sai VIF (Variance Inflation Factor) để kiểm tra vấn đề trên. Nếu VIF ≥ 10 thì có hiện tượng đa cộng tuyến (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2007).

3.4.4.4. Kiểm định các giả thuyết hồi quy

Tiêu chuẩn kiểm định sử dụng thống kê t và giá trị Sig. Giá trị Sig. được so sánh trực tiếp với giá trị 0.05 để kết luận chấp thuận hay bác bỏ giả thuyết nghiên cứu. Từ đó đưa ra kết luận biến có ý nghĩa thống kê hay không.

3.4.4.5. Kiểm định sự khác biệt trung bình

Ngoài ra, đề tài kiểm định sự khác biệt trung bình giữa các biến định tính và biến phụ thuộc điều này giúp xác định xem có sự khác biệt trung bình biến định lượng đối với các giá trị khác nhau của một biến định tính hay không.

Kiểm định sự khác biệt giữa trung bình hai đám đông T-test với trường hợp chọn 2 mẫu độc lập (gồm một biến định lượng và một biến định tính có hai phân loại): trước tiên cần kiểm định phương sai của hai mẫu định tính bằng cách kiểm định Levene. Nếu Sig. trong kiểm định Leneve ≥ 0.05 thì phương sai hai tổng thể bằng nhau vì vậy ta sẽ đọc kết quả kết quả ở dòng Equal variances assumed. Nếu giả sử giả định phương sai đồng nhất không được chấp nhận (Sig. < 0.05) chúng ta đọc kết quả so sánh hai trung bình ở dòng Equal variances not assumed. Giá trị sig T-test < 0.05 chúng ta kết luận có sự khác biệt mang ý nghĩa thống kê hoặc ngược lại Sig. T-test ≥ 0.05 không có sự khác biệt có ý nghĩa thống kê.

Đối với trường hợp so sánh trung bình từ ba đám đông trở lên ta dùng phương pháp phân tích phương sai ANOVA (Analysis of Variance). Nghiên cứu dùng phương pháp ANOVA 1 chiều (One-Way ANOVA). Trước tiên kiểm định Levene, Sig. Leneve ≥ 0.05 thì phương sai giữa các lựa chọn của biến định tính không khác nhau, xem kết quả bảng ANOVA nếu Sig. < 0.05 thì có sự khác biệt có ý nghĩa thống kê còn ngược lại sẽ không có sự khác biệt mang ý nghĩa thống kê. Nếu Sig. Leneve < 0.05 thì phương sai giữa các lựa chọn của biến định tính không bằng nhau ta cần kiểm định Krusskal-Wallis.

Các đặc điểm cá nhân Tần số % % Giá trị hợp lệ % Tích lũy Giới tính Nam 144 48.0 48.0 48.0 Nữ 156 520 520 100.0 Độ tuổi Từ 18-25 tuổi 171 570 570 57.0 Từ 26-30 tuổi 88 293 293 863 Từ 31-40 tuổi 31 103 10.3 96.7 Trên 40 tuổi 10 3.3 3.3 100.0 Thu nhập Dưới 5 tr 47 157 157 157 5-10 tr 159 53.0 53.0 687 10-15 tr 58 19.3 19.3 88.0 53 TÓM TẮT CHƯƠNG 3

Chương 3 đã trình bày cụ thể về quy trình nghiên cứu, cách xây dựng thang đo cũng như thiết kế bảng câu hỏi. Trong đó, nghiên cứu sơ bộ được tiến hành thông qua nghiên cứu định tính thảo luận với một thạc sĩ, sau đó tiến hành phỏng vấn trực tiếp 05 khách hàng đang sử dụng dịch vụ Ngân hàng số tại ngân hàng TMCP Tiên Phong. Một số phát biểu trong thang đo lý thuyết cũng được điều chỉnh lại câu từ cho rõ ràng, dễ hiểu và phù hợp với tình hình nghiên cứu. Bảng câu hỏi được thiết kế ba phần để sàng lọc những đáp viên phù hợp nhất. Ngoài ra, trình bày phương pháp chọn mẫu ngẫu nhiên, thu thập dữ liệu qua hai giai đoạn và một số phương pháp phân tích dữ liệu. Quy mô mẫu trong nghiên cứu chính thức là 310 mẫu nhưng chỉ có 300 bảng câu hỏi phản hồi đạt yêu cầu được đưa vào phân tích dữ liệu.

CHƯƠNG 4. KẾT QUẢ NGHIÊN CỨU

Chương 4 sẽ trình bày kết quả thực hiện nghiên cứu bao gồm thống kê mô tả các biến quan sát, kiểm định và đánh giá các thang đo, kiểm định sự phù hợp của mô hình nghiên cứu, kiểm định các giả thuyết trong mô hình, từ đó đưa ra mô hình hồi quy đã chuẩn hoá.

Các giả thuyết nghiên cứu

Phương pháp xây dựng thang đo