Kiểm định tương quan Person

CHƯƠNG 1 : CƠ SỞ LÝ LUẬN VỀ VẤN ĐỀ NGHIÊN CỨU

3.2 Kết quả nghiên cứu

3.2.4. Kiểm định tương quan Person

Hệ số tương quan person (Person corelation coeficient, kí hiệu r) đo lường mức độ tương quan tuyến tính giữa hai biến. Nguyên tắc cơ bản, tương quan person sẽ tìm ra một đường thẳng phù hợp nhất với mối quan hệ tuyến tính của hai biến. Chính vì vậy, phân tích tương quan Person đơi khi cịn được gọi là phân tích hồi quy giản đơn (nhưng khác nhau về mặt ý nghĩa).

Hệ số tương quan Person sẽ nhận giá trị từ -1 đến +1, r > 0 cho biết một sự tương quan dương giữa hai biến và ngược lại cho biết sự tương quan âm giữa hai biến, có nghĩa là nếu giá trị của biến này tăng thì sẽ làm giảm giá trị của biến kia và ngược lại.

Giá trị tuyệt đối của r càng cao thì mức độ tương quan giữa hai biến càng lớn hoặc dữ liệu càng phù hợp với quan hệ tuyến tính giữa hai biến. Giá trị r bằng +1 hoặc bằng -1 cho thấy dữ liệu hoàn toàn phù hợp với mơ hình tuyến tính.

Hệ số tương quan r:

r < 0,2: Không tương quan

r từ 0,2 đến 0,4: Tương quan yếu

r từ 0,4 đến 0,6: Tương quan trung bình r từ 0,6 đến 0,8: Tương quan mạnh r từ 0,8 đến 1: Tương quan rất mạnh

Lưu ý: Nếu chọn mức ý nghĩa 1% thì Sig. < 0,1, cịn nếu chọn mức ý nghĩa 5% thì Sig. < 0,05 tương đương với các dấu (*) được đánh dấu trên hệ số tương quan r.

a. Tạo nhân tố đại diện

Sau khi thực hiện xong phân tích nhân tố khám phá, để tiến hành phân tích tương quan Person và xa hơn nữa là hồi quy, ta cần tạo các nhân tố đại diện từ kết quả xoay nhân tố cuối cùng. Các biến đại diện lần lượt là:

CL = Mean(CL1, CL2, CL3, CL4, CL5) GC = Mean(GC1, GC2, GC3, GC4, GC5) TD = Mean(TD1, TD2, TD3, TD4) CCQ = Mean(CCQ1, CCQ2, CCQ3, CCQ4) NT = Mean(NT1, NT2, NT3, NT4) MD = Mean(MD1, MD2, MD3, MD4) KM = Mean(KM1, KM2, KM3)

b. Kiểm định tương quan Person

Đây là thao tác làm tiền đề để phân tích hồi quy đa biến.

Mục đích tương quan Person nhằm kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập, vì điều kiện hồi quy trước hết là phải tương quan.

Ngoài ra, vấn đề đa cộng tuyến khi các biến độc lập cũng có tương quan mạnh với nhau. Dấu hiệu nghi ngờ dựa vào giá trị Sig. tương quan giữa các biến độc lập nhỏ hơn 0,05 và giá trị tương quan Person lớn hơn 0,3.

Correlations QD CL GC NT TD CCQ MD KM QD Pearson Correlation 1 .429** .396** .418** .445** .149* .485** .412** Sig. (2-tailed) .000 .000 .000 .000 .036 .000 .000 N 200 200 200 200 200 200 200 200 CL Pearson Correlation .429** 1 .212** .147* .347** .118 .427** .296** Sig. (2-tailed) .000 .003 .038 .000 .096 .000 .000 N 200 200 200 200 200 200 200 200 GC Pearson Correlation .396** .212** 1 .308** .312** .129 .296** .257** Sig. (2-tailed) .000 .003 .000 .000 .070 .000 .000 N 200 200 200 200 200 200 200 200 NT Pearson Correlation .418** .147* .308** 1 .262** .002 .412** .249** Sig. (2-tailed) .000 .038 .000 .000 .979 .000 .000 N 200 200 200 200 200 200 200 200 TD Pearson Correlation .445** .347** .312** .262** 1 .170* .412** .357** Sig. (2-tailed) .000 .000 .000 .000 .016 .000 .000 N 200 200 200 200 200 200 200 200 CCQ Pearson Correlation .149* .118 .129 .002 .170* 1 .090 .185** Sig. (2-tailed) .036 .096 .070 .979 .016 .203 .009 N 200 200 200 200 200 200 200 200 MD Pearson Correlation .485** .427** .296** .412** .412** .090 1 .450** Sig. (2-tailed) .000 .000 .000 .000 .000 .203 .000 N 200 200 200 200 200 200 200 200 KM Pearson Correlation .412** .296** .257** .249** .357** .185** .450** 1 Sig. (2-tailed) .000 .000 .000 .000 .000 .009 .000 N 200 200 200 200 200 200 200 200

**. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed).

(Nguồn: Kết quả phân tích dữ liệu SPSS)

Giá trị Sig. của các biến CL, GC, NT, TD, CCQ, MD, KM đều nhỏ hơn 0,05 nghĩa là biến độc lập tương quan với biến phụ thuộc.

c. Xây dựng mơ hình hồi quy đơn tuyến tính

Đây là bước cuối trong q trình phân tích dữ liệu góp phần kiểm định các giả thuyết nghiên cứu:

Model Summaryb

Model R R Square Adjusted R

Square Std. Error of the Estimate Durbin-Watson 1 .660a .436 .415 .92634 2.053 a. Predictors: (Constant), KM, CCQ, NT, CL, GC, TD, MD b. Dependent Variable: QD

(Nguồn: Kết quả phân tích dữ liệu SPSS)

Trong bảng này, cần quan tâm hai giá trị:

Adjusted R Square (hoặc R Square- R bình phương hiệu chỉnh): Phản ánh mức độ ảnh hưởng của các biến độc lập lên biến phụ thuộc. Ở đây, các biến đưa vào ảnh hưởng 43,6% sự thay đổi của biến phụ thuộc, còn lại là do các biến ngồi mơ hình và sai số ngẫu nhiên.

Durbin- Watson (DW): Dùng để kiểm định tự tương quan của các sai số kề nhau (tương quan chuỗi bậc nhất) có giá trị biến thiên trong khoảng từ 0 đến 4; nếu các phần sai số khơng có tương quan chuỗi bậc nhất với nhau thì giá trị sẽ gần bằng 2 (từ 1 đến 3); nếu giá trị càng nhỏ, gần về 0 thì các phần sai số có tương quan thuận; nếu càng lớn, gần về 4 có nghĩa là các phần sai số có tương quan nghịch

Dựa vào bảng kết quả ta thấy giá trị Durbin Watson 2,053 xấp xỉ bằng 2, do vậy, có thể kết luận khơng có hiện tượng tự tương quan.

d. Kiểm định F

ANOVAa

Model Sum of

Squares

df Mean Square F Sig.

1 Regression 127.162 7 18.166 21.170 .000b Residual 164.758 192 .858 Total 291.920 199 a. Dependent Variable: QD b. Predictors: (Constant), KM, CCQ, NT, CL, GC, TD, MD

(Nguồn: Kết quả phân tích dữ liệu SPSS)

Tổng thể rất lớn, chúng ta khơng thể khảo sát tồn bộ, nên trong nghiên cứu, chúng ta chỉ chọn ra một lượng mẫu giới hạn để tiến hành điều tra, từ đó suy ra tính chất chung của tổng thể. Mục đích của kiểm định F trong bảng ANOVA chính là để kiểm tra xem mơ hình hồi quy tuyến tính này có suy rộng và áp dụng được cho tổng thể hay không.

Cụ thể trong trường hợp này, giá trị Sig. của kiểm định F trong bảng ANOVA là 0,000 < 0,05, như vậy, mơ hình hồi quy tuyến tính xây dựng được phù hợp với tổng thể.

e. Bảng Coefficients Coefficientsa Model Unstandardized Coefficients Standardized Coefficients t Sig. Collinearity Statistics B Std. Error

Beta Tolerance VIF

1 (Constant) -1.620 .449 -3.605 .000 CL .297 .088 .208 3.371 .001 .769 1.300 GC .222 .084 .159 2.650 .009 .820 1.219 NT .265 .078 .208 3.383 .001 .779 1.284 TD .220 .088 .159 2.502 .013 .729 1.371 CCQ .065 .092 .040 .709 .479 .941 1.062 MD .210 .110 .135 1.919 .056 .597 1.674 KM .245 .117 .133 2.100 .037 .734 1.361 a. Dependent Variable: QD

Giá trị Sig. kiểm định t từng biến độc lập, Sig. nhỏ hơn 0,05 có nghĩa là biến đó có ý nghĩa trong mơ hình, ngược lại Sig. lớn hơn 0,05 có nghĩa là biến độc lập cần được loại bỏ. Vì vậy, trong mơ hình này chỉ giữ lại biến CL, GC, NT, TD, KM.

Hệ số hồi quy chuẩn hóa Beta, trong tất cả các hệ số hồi quy, biến độc lập nào có Beta lớn nhất thì biến đó có ảnh hưởng nhiều nhất đến sự thay đổi của biến phụ thuộc QD. Cụ thể mức độ ảnh hưởng của các yếu tố đến QD như sau:

QD = 0,208*CL + 0,159*GC + 0,208*NT + 0,159*TD + 0,133*KM

Giá trị VIF dùng để kiểm tra hiện tượng đa cộng tuyến. Theo lý thuyết nhiều tài liệu viết, VIF <10 sẽ khơng có hiện tượng đa cộng tuyến. Tuy nhiên, trên thực tế với nhiều đề tài có mơ hình cộng thêm bảng câu hỏi có sử dụng thang đo Likert thì VIF < 2 sẽ khơng có đa cộng tuyến giữa các biến độc lập. Vì vậy, từ kết quả trên có thể nhận thấy mơ hình khơng xảy ra hiện tượng đa cộng tuyến giữa các biến độc lập.

f. Biểu đồ tần số phần dư chuẩn hóa Histogram

Phần dư có thể khơng tn theo phân phối chuẩn vì những lý do sau: Sử dụng sai mơ hình, phương sai khơng phải hằng số, số lượng phần dư không đủ nhiều để phân tích,... Vì vậy, chúng ta cần phải thực hiện nhiều cách khảo sát khác nhau. Một cách khảo sát đơn giản nhất là xây dựng biểu đồ tần số của các phần dư Histogram ngay dưới đây:

Biểu đồ 4.1 Tần số dư chuẩn hóa Histogram

(Nguồn: Kết quả phân tích dữ liệu SPSS)

Từ biểu đồ ta thấy được, một đường cong phân phối chuẩn được đặt chồng lên biểu đồ tần số. Đường cong này có dạng hình chng, phù hợp với dạng đồ thị của phân phối chuẩn. Giá trị trung bình Mean gần bằng 0, độ lệch chuẩn là 0,982 gần bằng 1, như vậy

có thể nói, phân phối phần dư xấp xỉ chuẩn. Do đó, có thể kết luận rằng: Giả thiết phân phối chuẩn của phần dư không bị vi phạm.

g. Đồ thị chuẩn hóa Normal P- P Plot

Ngồi cách kiểm tra bằng biểu đồ Histogram, thì P-P Plot cũng là một dạng biểu đồ được sử dụng phổ biến giúp nhận diện sự vi phạm giả định phần dư chuẩn hóa.

Biểu đồ 4.2 Đồ thị chuẩn hóa Normal P-P Plot

(Nguồn: Kết quả phân tích dữ liệu SPSS)

Với P-P Plot, các điểm phân vị trong phân phối của phần dư sẽ tập trung thành một đường chéo nếu phần dư có phân phối chuẩn. Cụ thể với dữ liệu nghiên cứu, các điểm phân vị trong phân phối của phần dư tập trung thành 1 đường chéo, như vậy, giả định phân phối chuẩn của phần dư không bị vi phạm.

h. Biểu đồ Scatter Plot kiểm tra giả định liên hệ tuyến tính

Biểu đồ phân tán Scatter Plot giữa các phần dư chuẩn hóa và giá trị dự đốn chuẩn hóa giúp chúng ta dị tìm xem, dữ liệu hiện tại có vi phạm giả định liên hệ tuyến tính hay khơng. Trong bài nghiên cứu, nhóm nghiên cứu biểu diễn giá trị phần dư chuẩn hóa ở trục hồnh và giá trị dự đốn chuẩn hóa ở trục tung.

Biểu đồ 4.3 Biểu đồ phân tán Scatter Plot

(Nguồn: Kết quả phân tích dữ liệu SPSS)

Kết quả đồ thị xuất ra, các điểm phân bố của phần dư nếu có các dạng: đồ thị Parabol, đồ thị Cubic,.. hay các dạng đồ thị khác khơng phải đường thẳng thì dữ liệu của bạn đã vi phạm giả định liên hệ tuyến tính. Nếu giả định quan hệ tuyến tính được thỏa mãn thì phần dư phải phân tán ngẫu nhiên trong một vùng xung quanh đường hoành độ 0. Cụ thể với tập dữ liệu đang sử dụng, phần dư chuẩn hóa phân bổ tập trung xunh quanh đường hoành độ 0, do vậy giả định quan hệ tuyến tính khơng bị vi phạm.

Tổng quan tình hình nghiên cứu

.6 Thang đo về mức độ phổ biến