HỒI QUY BINARY LOGISTIC
II. Cách thức đọc kết quả phân tích hồi quy Binary Logistic
Ví dụ: sử dụng phương pháp đưa biến vào mặc định là Enter. Phân tích mức độ ảnh hưởng của sự hài lòng về 4 dịch vụ đến mức độ hài lòng chung về điểm đến khi đi du lịch của du khách.
Y: mức độ hài lòng chung về điểm đến (0: không hài lòng, 1: hài lòng)
X1 X4: mức độ hài lòng về 4 dịch vụ (tương tự như phần hồi quy tuyến tính)
Thực hiện các bước trên để tiến hành phân tích. Kết quả xuất hiện với rất nhiều bảng.
Ta sẽ chú ý phân tích các bảng sau:
Bảng 1. Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 178.459 4 .000
Block 178.459 4 .000
Model 178.459 4 .000
Ở bảng 1, ta đọc kết quả kiểm định H0: β1 = β2 = … = βk = 0. Kiểm định này xem xét khả năng giải thích biến phụ thuộc của tổ hợp biến độc lập.
Kết quả ở bảng 1 cho thấy độ phù hợp tổng quát có mức ý nghĩa quan sát sig. = 0,000 nên ta bác bỏ H0. Nghĩa là tổ hợp liên hệ tuyến tính của toàn bộ các hệ số trong mô hình có ý nghĩa trong việc giải thích cho biến phụ thuộc.
Bảng 2. Model Summary
Step -2 Log likelihood
Cox & Snell R Square
Nagelkerke R Square
1 26.793a .595 .769
a. Estimation terminated at iteration number 6 because parameter estimates changed by less than .001.
Bảng 2 thể hiện kết quả độ phù hợp của mô hình. Khác với hồi quy tuyến tính thông thường hệ số R2 càng lớn thì mô hình càng phù hợp, hồi quy Binary Logistic sử dụng chỉ tiêu -2LL (-2 log likelihood) để đánh giá độ phù hợp của mô hình. -2LL càng nhỏ càng thể hiện độ phù hợp cao. Giá trị nhỏ nhất của -2LL là 0 (tức là không có sai số) khi đó mô hình có độ phù hợp hoàn hảo.
Kết quả bảng 2 cho thấy giá trị của -2LL = 26,472 không cao lắm, như vậy nó thể hiện một độ phù hợp khá tốt của mô hình tổng thể.
Bảng 3. Classification Tablea
Observed
Predicted
Satisfied dummy Percentage Correct Dissatisfied Satisfied
Step 1 Satisfied dummy Dissatisfied 51 49 51.0
Satisfied 22 389 94.6
Overall Percentage 86.1
a. The cut value is .500
Mức độ chính xác cũng được thể hiện ở bảng 3, bảng này cho thấy trong 73 trường hợp không hài lòng về điểm đến (xem theo cột) mô hình đã dự đoán đúng 49 trường hợp (xem theo hàng), vậy tỷ lệ đúng là 51%. Còn với 438 trường hợp hài lòng về điểm đến, mô hình dự đoán sai 22 trường hợp, tỷ lệ đúng là 94,6%. Từ đó ta tính được tỷ lệ dự đoán đúng của toàn bộ mô hình là 86,1%.
Bảng 4. Variables in the Equation
B S.E. Wald df Sig. Exp(B)
Step 1a Satisfied with Accom 1.567 .255 37.812 1 .000 4.794
Satisfied with Food .435 .249 3.051 1 .031 1.546
Satisfied with Shopping .672 .222 9.164 1 .002 1.959
Satisfied with Transp .918 .228 16.273 1 .000 2.505
Constant -11.737 1.347 75.891 1 .000 .000
a. Variable(s) entered on step 1: Q3.2.a, Q3.2.f, Q3.2.s, Q3.2.t.
Bảng 4 thể hiện kết quả của kiểm định Wald (kiểm định giả thuyết hồi quy khác không). Nếu hệ số hồi quy B0 và B1 đều bằng 0 thì tỷ lệ chênh lệch giữa các xác suất sẽ bằng 1, tức xác suất để sự kiện xảy ra hay không xảy ra như nhau, lúc đó mô hình hồi quy không có tác dụng dự đoán.
Đối với hồi quy tuyến tính sử dụng kiểm định t để kiểm định giả thuyết H0: βk=0. Còn đối với hồi quy Binary Logistic, đại lượng Wald Chi Square được sử dụng để kiểm định ý nghĩa thống kê của hệ số hồi quy tổng thể.
Kết quả bảng 4 cho thấy mức độ hài lòng về 4 dịch vụ có giá trị p (sig.) nhỏ hơn mức ý nghĩa α = 0,05 bác bỏ H0. Như vậy các hệ số hồi quy tìm được có ý nghĩa và mô hình được sử dụng tốt.
Từ các hệ số hồi quy này ta viết được phương trình:
Diễn giải ý nghĩa của các hệ số hồi quy Binary Logistic như sau:
Mức độ hài lòng về 4 dịch vụ đều làm tăng mức độ hài lòng chung về điểm đến , trong đó hài lòng về DV lưu trú tác động mạnh nhất. Cụ thể tác động biên của
mức độ hài lòng về DV lưu trú lên mức độ hài lòng chung với xác suất ban đầu = 0,5 thì tác động này bằng 0,5(1-0,5)1,57 = 0,3925.
VẬN DỤNG MÔ HÌNH HỒI QUY BINARY LOGISTIC CHO MỤC ĐÍCH DỰ BÁO Mô hình hồi quy Binary Logistic có thể được áp dụng để dự báo khả năng trả nợ khi đối tượng đi vay hay dự báo nhu cầu sử dụng một sản phẩm cụ thể nào đó. Ta sử dụng công thức sau:
CÁCH THỨC TIẾN HÀNH PHÂN TÍCH NHÂN TỐ
1. Từ menu Analyze Data Reduction Factor
2. Xuất hiện hộp thoại sau:
3. Chọn tất cả các biến cần gom nhóm vào ô Variables.
4. Click chọn ô Descriptives…, xuất hiện hộp thoại sau:
- Chọn tính các ma trận hệ số tương quan.
- Chọn kiểm định Bartlett. Trong phân tích nhân tố, cần kiểm định mối tương quan của các biến với nhau (H0: các biến không có tương quan với nhau trong tổng thể).
Nếu giả thuyết H0 không được bác bỏ thì phân tích nhân tố có khả năng không thích hợp.
- Click continue để trở lại hộp thoại Factor analysis 5. Click chọn ô Extraction để mở hộp thoại sau:
- Chọn phương pháp rút trích nhân tố, phương pháp mặc định là rút các thành phần chính – Principal components.
- Phân tích ma trận tương quan hay hiệp phương sai ở ô Analyze.
- Thể hiện phương án nhân tố chưa xoay và vẽ biểu đồ dốc ở ô Display.
- Xác định tiêu chuẩn rút trích nhân tố hay số lượng nhân tố cần rút trích.
Có 2 cách để xác định tiêu chuẩn này ở ô Extract:
• Xác định từ trước dựa vào ý đồ của nhà nghiên cứu và kết quả của các cuộc nghiên cứu trước. Nhà nghiên cứu xác định số nhân tố ở ô Number of factors.
• Xác định dựa vào Eigenvalue (Determination based on eigenvalue. Chỉ có những nhân tố nào lớn hơn 1 mới được giữ lại trong mô hình phân tích.
- Click Continue để trở lại hộp thoại Factor Analysis.
6. Click chọn ô Rotation (Xoay nhân tố) để mở hộp thoại sau:
Xoay nhân tố là thủ tục giúp ma trận nhân tố trở nên đơn giản và dễ giải thích hơn.
Có nhiều phương pháp xoay khác nhau trong đó được sử dụng rộng rãi nhất là Varimax procedure (xoay nguyên góc các nhân tố để tối thiểu hoá số lượng biến có hệ số lớn tại cùng một nhân tố, vì vậy sẽ tăng cường khả năng giải thích các nhân tố).
Click Continue để trở lại hộp thoại chính.
7. Click chọn ô Factor Score để tính điểm các nhân tố
Nếu nhà nghiên cứu muốn xác định tập hợp nhân tố ít hơn để sử dụng trong các phương pháp phân tích đa biến tiếp theo (phân tích ANOVA, hồi quy…), ta có thể tính toán ra các nhân số (trị số của các biến tổng hợp) cho từng trường hợp quan sát một. Nhân số của nhân tố thứ i bằng:
Fi = Wi1X1 + Wi2X2 + Wi3X3 + … + WikXk
Máy tính sẽ tính các nhân số này và tự động save vào file dữ liệu những biến mới này.
- Mặc định của chương trình là phương pháp tính nhân số Regression (theo đơn vị đo lường độ lệch chuẩn).
- Chọn thể hiện bảng trọng số nhân tố bằng cách click vào ô Display factor …
- Click Continue để trở lại hộp thoại ban đầu click Ok để thực hiện lệnh.
ĐỌC KẾT QUẢ CỦA VÍ DỤ SAU
VD: xác định nhân tố ảnh hưởng đến quyết định chọn nhà trọ của sinh viên khoa công nghệ trường Đại học Cần thơ.
Bảng 1. Descriptive Statistics
Mean Std. Deviation Analysis N
gia ca 3.91 1.065 43
ve sinh 4.05 .950 43
an ninh 4.35 .948 43
moi truong song 4.09 .811 43
gan truong 3.60 1.072 43
gan khu vui choi, giai tri 3.28 1.161 43
phong co gac lung 3.33 .993 43
co nha ve sinh trong phong 3.67 1.063 43
noi qui 3.79 .940 43
dien, nuoc 4.16 .871 43
Bảng 2. Correlation Matrix Correlation
gia ca ve sinh an ninh moi truong
song
gan truong
gan khu vui choi, giai tri
phong co gac lung
co nha ve sinh trong
phong noi qui dien, nuoc
gia ca 1.000 .522 .528 .313 .238 .291 .209 .288 .123 .402
ve sinh .522 1.000 .801 .581 .392 .096 .337 .298 .198 .393
an ninh .528 .801 1.000 .607 .303 .191 .129 .281 .378 .535
moi truong song .313 .581 .607 1.000 .372 .174 .021 .257 .307 .315
gan truong .238 .392 .303 .372 1.000 .569 .325 .219 .034 .275
gan khu vui
choi, giai tri .291 .096 .191 .174 .569 1.000 .270 .365 .142 .401
phong co gac
lung .209 .337 .129 .021 .325 .270 1.000 .238 .049 .130
co nha ve sinh
trong phong .288 .298 .281 .257 .219 .365 .238 1.000 .478 .470
noi qui .123 .198 .378 .307 .034 .142 .049 .478 1.000 .479
dien, nuoc .402 .393 .535 .315 .275 .401 .130 .470 .479 1.000
Bảng 1 thể hiện đại lượng thống kê mô tả.
Bảng 2 thể hiện ma trận tương quan giữa các biến. Ta thấy hệ số tương quan giữa các biến trong ma trận này tương đối cao.
Bảng 3 thể hiện kết quả của kiểm định Barlett. Dựa vào kết quả này ta có thể bác bỏ H0 (Các biến không có tương quan với nhau). Phân tích nhân tố là phương pháp phù hợp để phân tích ma trận tương quan ở bảng 2.
Bảng 3. KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .714 Bartlett's Test of Sphericity Approx. Chi-Square 167.933
df 45
Sig. .000
Dựa vào bảng 5 và theo tiêu chuẩn eigenvalue lớn hơn 1 thì chỉ có 3 nhân tố được rút trích ra.
Giá trị Cumulative % cho biết 3 nhân tố đầu giải thích 66.78% biến thiên của dữ liệu.
Bảng số 4 (bảng Cummunalities) cho biết thông tin về phần biến thiên được giải thích bởi các nhân tố chung.
Bảng số 6 là bảng thể hiện các nhân tố chưa xoay. Để dễ dàng giải thích các nhân tố hơn ta sử dụng bảng số 7 để đọc kết quả.
Bảng 5. Total Variance Explained Component
1 2 3 4 5 6 7 8 9 10
Initial Eigenvalues
Total 3.989 1.406 1.283 .892 .760 .526 .412 .324 .290 .119
% of Variance 39.892 14.058 12.829 8.916 7.599 5.259 4.116 3.238 2.903 1.191 Cumulative % 39.892 53.949 66.778 75.694 83.293 88.552 92.668 9.591E1 98.809 1.000E2 Extraction
Sums of Squared Loadings
Total 3.989 1.406 1.283
% of Variance 39.892 14.058 12.829 Cumulative % 39.892 53.949 66.778 Rotation Sums
of Squared Loadings
Total 2.776 2.006 1.896
% of Variance 27.758 20.056 18.965 Cumulative % 27.758 47.814 66.778 Extraction Method: Principal Component Analysis.
Bảng 6. Component Matrixa Component
1 2 3
gia ca .647 -.039 -.221
ve sinh .781 -.245 -.419
an ninh .814 -.379 -.205
moi truong song .667 -.324 -.206
gan truong .573 .527 -.268
gan khu vui choi, giai tri .514 .661 .179
phong co gac lung .369 .529 -.184
co nha ve sinh trong phong .601 .127 .525
noi qui .498 -.288 .651
dien, nuoc .718 -.040 .369
Extraction Method: Principal Component Analysis.
a. 3 components extracted.
Bảng 7. Rotated Component Matrixa Component
1 2 3
gia ca (1) .604 .149 .286
ve sinh (2) .896 .069 .198
an ninh (3) .875 .280 .056
moi truong song (4) .743 .198 .041
gan truong (5) .312 .020 .762
gan khu vui choi, giai tri (6) -.015 .358 .778
phong co gac lung (7) .119 -.014 .660
co nha ve sinh trong phong (8) .124 .746 .285
noi qui (9) .176 .838 -.148
dien, nuoc (10) .364 .689 .215
Dựa vào bảng số 7 ta thấy biến 1,2,3,4 có tương quan mạnh với nhau và thuộc nhân tố thứ 1.
Tương tự nhân tố 2 bao gồm các biến 8,9,10. Các biến 5,6,7 là các biến giải thích cho nhân tố 3.
Dựa vào những điểm giống nhau (thể hiện tính chung) của biến nằm trong nhân tố và những nghiên cứu trước nhà nghiên cứu sẽ đặt tên cho những nhân tố này.
VD: nhóm 1 là nhân tố an toàn; nhóm 2 là nhân tố điều kiện sinh hoạt; nhóm 3 là nhân tố vị trí thuận lợi.
Bảng 8. Component Transformation Matrix
Component 1 2 3
1 .736 .516 .437
2 -.461 -.090 .883
3 -.495 .852 -.171
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
Bảng 9. Component Score Coefficient Matrix Component
1 2 3
gia ca .218 -.060 .076
ve sinh .386 -.161 -.012
an ninh .354 -.006 -.122
moi truong song .309 -.030 -.103
gan truong .036 -.138 .430
gan khu vui choi, giai tri -.191 .143 .448
phong co gac lung -.034 -.108 .397
co nha ve sinh trong phong -.134 .418 .076
noi qui -.065 .515 -.213
dien, nuoc .003 .341 .004
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
Component Scores.
Bảng 10. Component Score Covariance Matrix
Component 1 2 3
1 1.000 .000 .000
2 .000 1.000 .000
3 .000 .000 1.000
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
Component Scores.
Dựa vào bảng 8, 9 và 10 ta xác định nhân số như sau:
F1 = 0.218*giá cả + 0.386*vệ sinh + 0.354*an ninh + 0.309*môi trường sống
F2 = 0.418*có nhà vệ sinh trong phòng + 0.515*nội quy + 0.341*điện nước F3 = 0.430*gần trường + 0.448*gần khu vui chơi + 0.397*có gác lửng