Cách thức đọc kết quả phân tích hồi quy Binary Log- 123docz.net

HỒI QUY BINARY LOGISTIC

II. Cách thức đọc kết quả phân tích hồi quy Binary Logistic

Ví dụ: sử dụng phương pháp đưa biến vào mặc định là Enter. Phân tích mức độ ảnh hưởng của sự hài lòng về 4 dịch vụ đến mức độ hài lòng chung về điểm đến khi đi du lịch của du khách.

Y: mức độ hài lòng chung về điểm đến (0: không hài lòng, 1: hài lòng)

X1  X4: mức độ hài lòng về 4 dịch vụ (tương tự như phần hồi quy tuyến tính)

Thực hiện các bước trên để tiến hành phân tích. Kết quả xuất hiện với rất nhiều bảng.

Ta sẽ chú ý phân tích các bảng sau:

Bảng 1. Omnibus Tests of Model Coefficients

Chi-square df Sig.

Step 1 Step 178.459 4 .000

Block 178.459 4 .000

Model 178.459 4 .000

Ở bảng 1, ta đọc kết quả kiểm định H0: β1 = β2 = … = βk = 0. Kiểm định này xem xét khả năng giải thích biến phụ thuộc của tổ hợp biến độc lập.

Kết quả ở bảng 1 cho thấy độ phù hợp tổng quát có mức ý nghĩa quan sát sig. = 0,000 nên ta bác bỏ H0. Nghĩa là tổ hợp liên hệ tuyến tính của toàn bộ các hệ số trong mô hình có ý nghĩa trong việc giải thích cho biến phụ thuộc.

Bảng 2. Model Summary

Step -2 Log likelihood

Cox & Snell R Square

Nagelkerke R Square

1 26.793a .595 .769

a. Estimation terminated at iteration number 6 because parameter estimates changed by less than .001.

Bảng 2 thể hiện kết quả độ phù hợp của mô hình. Khác với hồi quy tuyến tính thông thường hệ số R2 càng lớn thì mô hình càng phù hợp, hồi quy Binary Logistic sử dụng chỉ tiêu -2LL (-2 log likelihood) để đánh giá độ phù hợp của mô hình. -2LL càng nhỏ càng thể hiện độ phù hợp cao. Giá trị nhỏ nhất của -2LL là 0 (tức là không có sai số) khi đó mô hình có độ phù hợp hoàn hảo.

Kết quả bảng 2 cho thấy giá trị của -2LL = 26,472 không cao lắm, như vậy nó thể hiện một độ phù hợp khá tốt của mô hình tổng thể.

Bảng 3. Classification Tablea

Observed

Predicted

Satisfied dummy Percentage Correct Dissatisfied Satisfied

Step 1 Satisfied dummy Dissatisfied 51 49 51.0

Satisfied 22 389 94.6

Overall Percentage 86.1

a. The cut value is .500

Mức độ chính xác cũng được thể hiện ở bảng 3, bảng này cho thấy trong 73 trường hợp không hài lòng về điểm đến (xem theo cột) mô hình đã dự đoán đúng 49 trường hợp (xem theo hàng), vậy tỷ lệ đúng là 51%. Còn với 438 trường hợp hài lòng về điểm đến, mô hình dự đoán sai 22 trường hợp, tỷ lệ đúng là 94,6%. Từ đó ta tính được tỷ lệ dự đoán đúng của toàn bộ mô hình là 86,1%.

Bảng 4. Variables in the Equation

B S.E. Wald df Sig. Exp(B)

Step 1a Satisfied with Accom 1.567 .255 37.812 1 .000 4.794

Satisfied with Food .435 .249 3.051 1 .031 1.546

Satisfied with Shopping .672 .222 9.164 1 .002 1.959

Satisfied with Transp .918 .228 16.273 1 .000 2.505

Constant -11.737 1.347 75.891 1 .000 .000

a. Variable(s) entered on step 1: Q3.2.a, Q3.2.f, Q3.2.s, Q3.2.t.

Bảng 4 thể hiện kết quả của kiểm định Wald (kiểm định giả thuyết hồi quy khác không). Nếu hệ số hồi quy B0 và B1 đều bằng 0 thì tỷ lệ chênh lệch giữa các xác suất sẽ bằng 1, tức xác suất để sự kiện xảy ra hay không xảy ra như nhau, lúc đó mô hình hồi quy không có tác dụng dự đoán.

Đối với hồi quy tuyến tính sử dụng kiểm định t để kiểm định giả thuyết H0: βk=0. Còn đối với hồi quy Binary Logistic, đại lượng Wald Chi Square được sử dụng để kiểm định ý nghĩa thống kê của hệ số hồi quy tổng thể.

Kết quả bảng 4 cho thấy mức độ hài lòng về 4 dịch vụ có giá trị p (sig.) nhỏ hơn mức ý nghĩa α = 0,05  bác bỏ H0. Như vậy các hệ số hồi quy tìm được có ý nghĩa và mô hình được sử dụng tốt.

Từ các hệ số hồi quy này ta viết được phương trình:

Diễn giải ý nghĩa của các hệ số hồi quy Binary Logistic như sau:

Mức độ hài lòng về 4 dịch vụ đều làm tăng mức độ hài lòng chung về điểm đến , trong đó hài lòng về DV lưu trú tác động mạnh nhất. Cụ thể tác động biên của

mức độ hài lòng về DV lưu trú lên mức độ hài lòng chung với xác suất ban đầu = 0,5 thì tác động này bằng 0,5(1-0,5)1,57 = 0,3925.

VẬN DỤNG MÔ HÌNH HỒI QUY BINARY LOGISTIC CHO MỤC ĐÍCH DỰ BÁO Mô hình hồi quy Binary Logistic có thể được áp dụng để dự báo khả năng trả nợ khi đối tượng đi vay hay dự báo nhu cầu sử dụng một sản phẩm cụ thể nào đó. Ta sử dụng công thức sau:

CÁCH THỨC TIẾN HÀNH PHÂN TÍCH NHÂN TỐ

1. Từ menu Analyze  Data Reduction  Factor

2. Xuất hiện hộp thoại sau:

3. Chọn tất cả các biến cần gom nhóm vào ô Variables.

4. Click chọn ô Descriptives…, xuất hiện hộp thoại sau:

- Chọn tính các ma trận hệ số tương quan.

- Chọn kiểm định Bartlett. Trong phân tích nhân tố, cần kiểm định mối tương quan của các biến với nhau (H0: các biến không có tương quan với nhau trong tổng thể).

Nếu giả thuyết H0 không được bác bỏ thì phân tích nhân tố có khả năng không thích hợp.

- Click continue để trở lại hộp thoại Factor analysis 5. Click chọn ô Extraction để mở hộp thoại sau:

- Chọn phương pháp rút trích nhân tố, phương pháp mặc định là rút các thành phần chính – Principal components.

- Phân tích ma trận tương quan hay hiệp phương sai ở ô Analyze.

- Thể hiện phương án nhân tố chưa xoay và vẽ biểu đồ dốc ở ô Display.

- Xác định tiêu chuẩn rút trích nhân tố hay số lượng nhân tố cần rút trích.

Có 2 cách để xác định tiêu chuẩn này ở ô Extract:

• Xác định từ trước dựa vào ý đồ của nhà nghiên cứu và kết quả của các cuộc nghiên cứu trước. Nhà nghiên cứu xác định số nhân tố ở ô Number of factors.

• Xác định dựa vào Eigenvalue (Determination based on eigenvalue. Chỉ có những nhân tố nào lớn hơn 1 mới được giữ lại trong mô hình phân tích.

- Click Continue để trở lại hộp thoại Factor Analysis.

6. Click chọn ô Rotation (Xoay nhân tố) để mở hộp thoại sau:

Xoay nhân tố là thủ tục giúp ma trận nhân tố trở nên đơn giản và dễ giải thích hơn.

Có nhiều phương pháp xoay khác nhau trong đó được sử dụng rộng rãi nhất là Varimax procedure (xoay nguyên góc các nhân tố để tối thiểu hoá số lượng biến có hệ số lớn tại cùng một nhân tố, vì vậy sẽ tăng cường khả năng giải thích các nhân tố).

Click Continue để trở lại hộp thoại chính.

7. Click chọn ô Factor Score để tính điểm các nhân tố

Nếu nhà nghiên cứu muốn xác định tập hợp nhân tố ít hơn để sử dụng trong các phương pháp phân tích đa biến tiếp theo (phân tích ANOVA, hồi quy…), ta có thể tính toán ra các nhân số (trị số của các biến tổng hợp) cho từng trường hợp quan sát một. Nhân số của nhân tố thứ i bằng:

Fi = Wi1X1 + Wi2X2 + Wi3X3 + … + WikXk

Máy tính sẽ tính các nhân số này và tự động save vào file dữ liệu những biến mới này.

- Mặc định của chương trình là phương pháp tính nhân số Regression (theo đơn vị đo lường độ lệch chuẩn).

- Chọn thể hiện bảng trọng số nhân tố bằng cách click vào ô Display factor …

- Click Continue để trở lại hộp thoại ban đầu  click Ok để thực hiện lệnh.

ĐỌC KẾT QUẢ CỦA VÍ DỤ SAU

VD: xác định nhân tố ảnh hưởng đến quyết định chọn nhà trọ của sinh viên khoa công nghệ trường Đại học Cần thơ.

Bảng 1. Descriptive Statistics

Mean Std. Deviation Analysis N

gia ca 3.91 1.065 43

ve sinh 4.05 .950 43

an ninh 4.35 .948 43

moi truong song 4.09 .811 43

gan truong 3.60 1.072 43

gan khu vui choi, giai tri 3.28 1.161 43

phong co gac lung 3.33 .993 43

co nha ve sinh trong phong 3.67 1.063 43

noi qui 3.79 .940 43

dien, nuoc 4.16 .871 43

Bảng 2. Correlation Matrix Correlation

gia ca ve sinh an ninh moi truong

song

gan truong

gan khu vui choi, giai tri

phong co gac lung

co nha ve sinh trong

phong noi qui dien, nuoc

gia ca 1.000 .522 .528 .313 .238 .291 .209 .288 .123 .402

ve sinh .522 1.000 .801 .581 .392 .096 .337 .298 .198 .393

an ninh .528 .801 1.000 .607 .303 .191 .129 .281 .378 .535

moi truong song .313 .581 .607 1.000 .372 .174 .021 .257 .307 .315

gan truong .238 .392 .303 .372 1.000 .569 .325 .219 .034 .275

gan khu vui

choi, giai tri .291 .096 .191 .174 .569 1.000 .270 .365 .142 .401

phong co gac

lung .209 .337 .129 .021 .325 .270 1.000 .238 .049 .130

co nha ve sinh

trong phong .288 .298 .281 .257 .219 .365 .238 1.000 .478 .470

noi qui .123 .198 .378 .307 .034 .142 .049 .478 1.000 .479

dien, nuoc .402 .393 .535 .315 .275 .401 .130 .470 .479 1.000

Bảng 1 thể hiện đại lượng thống kê mô tả.

Bảng 2 thể hiện ma trận tương quan giữa các biến. Ta thấy hệ số tương quan giữa các biến trong ma trận này tương đối cao.

Bảng 3 thể hiện kết quả của kiểm định Barlett. Dựa vào kết quả này ta có thể bác bỏ H0 (Các biến không có tương quan với nhau).  Phân tích nhân tố là phương pháp phù hợp để phân tích ma trận tương quan ở bảng 2.

Bảng 3. KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .714 Bartlett's Test of Sphericity Approx. Chi-Square 167.933

df 45

Sig. .000

Dựa vào bảng 5 và theo tiêu chuẩn eigenvalue lớn hơn 1 thì chỉ có 3 nhân tố được rút trích ra.

Giá trị Cumulative % cho biết 3 nhân tố đầu giải thích 66.78% biến thiên của dữ liệu.

Bảng số 4 (bảng Cummunalities) cho biết thông tin về phần biến thiên được giải thích bởi các nhân tố chung.

Bảng số 6 là bảng thể hiện các nhân tố chưa xoay. Để dễ dàng giải thích các nhân tố hơn ta sử dụng bảng số 7 để đọc kết quả.

Bảng 5. Total Variance Explained Component

1 2 3 4 5 6 7 8 9 10

Initial Eigenvalues

Total 3.989 1.406 1.283 .892 .760 .526 .412 .324 .290 .119

% of Variance 39.892 14.058 12.829 8.916 7.599 5.259 4.116 3.238 2.903 1.191 Cumulative % 39.892 53.949 66.778 75.694 83.293 88.552 92.668 9.591E1 98.809 1.000E2 Extraction

Sums of Squared Loadings

Total 3.989 1.406 1.283

% of Variance 39.892 14.058 12.829 Cumulative % 39.892 53.949 66.778 Rotation Sums

of Squared Loadings

Total 2.776 2.006 1.896

% of Variance 27.758 20.056 18.965 Cumulative % 27.758 47.814 66.778 Extraction Method: Principal Component Analysis.

Bảng 6. Component Matrixa Component

1 2 3

gia ca .647 -.039 -.221

ve sinh .781 -.245 -.419

an ninh .814 -.379 -.205

moi truong song .667 -.324 -.206

gan truong .573 .527 -.268

gan khu vui choi, giai tri .514 .661 .179

phong co gac lung .369 .529 -.184

co nha ve sinh trong phong .601 .127 .525

noi qui .498 -.288 .651

dien, nuoc .718 -.040 .369

Extraction Method: Principal Component Analysis.

a. 3 components extracted.

Bảng 7. Rotated Component Matrixa Component

1 2 3

gia ca (1) .604 .149 .286

ve sinh (2) .896 .069 .198

an ninh (3) .875 .280 .056

moi truong song (4) .743 .198 .041

gan truong (5) .312 .020 .762

gan khu vui choi, giai tri (6) -.015 .358 .778

phong co gac lung (7) .119 -.014 .660

co nha ve sinh trong phong (8) .124 .746 .285

noi qui (9) .176 .838 -.148

dien, nuoc (10) .364 .689 .215

Dựa vào bảng số 7 ta thấy biến 1,2,3,4 có tương quan mạnh với nhau và thuộc nhân tố thứ 1.

Tương tự nhân tố 2 bao gồm các biến 8,9,10. Các biến 5,6,7 là các biến giải thích cho nhân tố 3.

Dựa vào những điểm giống nhau (thể hiện tính chung) của biến nằm trong nhân tố và những nghiên cứu trước nhà nghiên cứu sẽ đặt tên cho những nhân tố này.

VD: nhóm 1 là nhân tố an toàn; nhóm 2 là nhân tố điều kiện sinh hoạt; nhóm 3 là nhân tố vị trí thuận lợi.

Bảng 8. Component Transformation Matrix

Component 1 2 3

1 .736 .516 .437

2 -.461 -.090 .883

3 -.495 .852 -.171

Extraction Method: Principal Component Analysis.

Rotation Method: Varimax with Kaiser Normalization.

Bảng 9. Component Score Coefficient Matrix Component

1 2 3

gia ca .218 -.060 .076

ve sinh .386 -.161 -.012

an ninh .354 -.006 -.122

moi truong song .309 -.030 -.103

gan truong .036 -.138 .430

gan khu vui choi, giai tri -.191 .143 .448

phong co gac lung -.034 -.108 .397

co nha ve sinh trong phong -.134 .418 .076

noi qui -.065 .515 -.213

dien, nuoc .003 .341 .004

Extraction Method: Principal Component Analysis.

Rotation Method: Varimax with Kaiser Normalization.

Component Scores.

Bảng 10. Component Score Covariance Matrix

Component 1 2 3

1 1.000 .000 .000

2 .000 1.000 .000

3 .000 .000 1.000

Extraction Method: Principal Component Analysis.

Rotation Method: Varimax with Kaiser Normalization.

Component Scores.

Dựa vào bảng 8, 9 và 10 ta xác định nhân số như sau:

F1 = 0.218*giá cả + 0.386*vệ sinh + 0.354*an ninh + 0.309*môi trường sống

F2 = 0.418*có nhà vệ sinh trong phòng + 0.515*nội quy + 0.341*điện nước F3 = 0.430*gần trường + 0.448*gần khu vui chơi + 0.397*có gác lửng

Cách thức đọc kết quả phân tích hồi quy Binary Logistic

XỬ LÝ CÂU HỎI NHIỀU LỰA CHỌN

Tiến hành tính toán cho nhóm