SPSS 16.0HỒI QUY BINARY LOGiSTIC Hồi quy Binary Logistic sử dụng biến phụ thuộc dạng nhị phân để ước lượng xác suất một sự kiện sẽ xảy ra với những thông tin của biến độc lập mà ta có đư
Trang 1SPSS 16.0
HỒI QUY BINARY LOGiSTIC
Hồi quy Binary Logistic sử dụng biến phụ thuộc dạng nhị phân để ước lượng xác suất một sự kiện sẽ xảy ra với những thông tin của biến độc lập mà ta có được Khi biến phụ thuộc ở dạng nhị phân ( hai biểu hiện 0 và 1) thì không thể phân tích với dạng hồi quy thông thường mà phải sử dụng hồi quy Binary Logistic
I Cách thức tiến hành phân tích hồi quy Binary Logistic với SPSS
1 Vào menu Analyze Regression Binary Logistic, xuất hiện hộp thoại sau:
2 Đưa biến phụ thuộc Y dạng nhị phân vào ô dependent, và biến độc lập sang khung Covariate
3 Chọn phương pháp đưa biến vào (Method) tương tự như hồi quy tuyến tính thông thường Tuy nhiên điều kiện căn cứ trên số thống kê likelihood-ratio (tỷ lệ thích hợp) hay số thống kê Wald
- Enter: đưa vào bắt buộc, các biến trong khối biến độc lập được đưa vào trong một bước
- Forward: Conditional là phương pháp đưa dần vào theo điều kiện Nó kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên những ước lượng thông số có điều kiện
- Forward: LR là phương pháp đưa dần vào kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên ước lượng khả năng xảy ra tối đa (maximum-likelihood estimates)
- Forward: Wald là phương pháp đưa dần vào kiểm tra việc loại biến căn cứ trên
Trang 2- Backward: Conditional là phương pháp loại trừ dần theo điều kiện Nó kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên những ước lượng thông số có điều kiện
- Backward: LR là phương pháp loại trừ dần vào kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên ước lượng khả năng xảy ra tối đa
- Backward: Wald là phương pháp đưa dần vào kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Wald
- Stepwise: hồi quy từng bước, số thống kê được sử dụng cho các biến được đưa vào và loại ra căn cứ trên số thống kê Likelihood-ratio, hay số thống kê Wald
4 Để hiện đồ thị phân loại giá trị thật và giá trị dự báo của biến phụ thuộc, chọn Option, chọn Classification plots trong phần Statistics and plots Click Continue trở
về hộp thoại đầu tiên
5 Muốn tính được giá trị dự đoán, là xác suất mà một đối tượng sẽ … (biến phụ thuộc Y), ta chọn Predict value trong hộp thoại Save Chọn Continue Ok để thực hiện lệnh
Trang 3II Cách thức đọc kết quả phân tích hồi quy Binary Logistic
Ví dụ: sử dụng phương pháp đưa biến vào mặc định là Enter Phân tích mức độ ảnh hưởng của sự hài lòng về 4 dịch vụ đến mức độ hài lòng chung về điểm đến khi đi du lịch của du khách
Y: mức độ hài lòng chung về điểm đến (0: không hài lòng, 1: hài lòng)
X1 X4: mức độ hài lòng về 4 dịch vụ (tương tự như phần hồi quy tuyến tính) Thực hiện các bước trên để tiến hành phân tích Kết quả xuất hiện với rất nhiều bảng
Ta sẽ chú ý phân tích các bảng sau:
Bảng 1 Omnibus Tests of Model Coefficients
Ở bảng 1, ta đọc kết quả kiểm định H0: β1 = β2 = … = βk = 0 Kiểm định này xem xét khả năng giải thích biến phụ thuộc của tổ hợp biến độc lập
Kết quả ở bảng 1 cho thấy độ phù hợp tổng quát có mức ý nghĩa quan sát sig = 0,000 nên ta bác bỏ H0 Nghĩa là tổ hợp liên hệ tuyến tính của toàn bộ các hệ số trong mô hình có
ý nghĩa trong việc giải thích cho biến phụ thuộc
Bảng 2 Model Summary
Step -2 Log likelihood
Cox & Snell R Square
Nagelkerke R Square
a Estimation terminated at iteration number 6 because parameter estimates changed by less than 001.
Bảng 2 thể hiện kết quả độ phù hợp của mô hình Khác với hồi quy tuyến tính thông thường hệ số R2 càng lớn thì mô hình càng phù hợp, hồi quy Binary Logistic sử dụng chỉ tiêu -2LL (-2 log likelihood) để đánh giá độ phù hợp của mô hình -2LL càng nhỏ càng thể hiện độ phù hợp cao Giá trị nhỏ nhất của -2LL là 0 (tức là không có sai số) khi đó mô hình
có độ phù hợp hoàn hảo
Kết quả bảng 2 cho thấy giá trị của -2LL = 26,472 không cao lắm, như vậy nó thể hiện một độ phù hợp khá tốt của mô hình tổng thể
Trang 4Bảng 3 Classification Table a
Satisfied dummy Percentage
Correct Dissatisfied Satisfied
a The cut value is 500
Mức độ chính xác cũng được thể hiện ở bảng 3, bảng này cho thấy trong 73 trường hợp không hài lòng về điểm đến (xem theo cột) mô hình đã dự đoán đúng 49 trường hợp (xem theo hàng), vậy tỷ lệ đúng là 51% Còn với 438 trường hợp hài lòng về điểm đến, mô hình dự đoán sai
22 trường hợp, tỷ lệ đúng là 94,6% Từ đó ta tính được tỷ lệ dự đoán đúng của toàn bộ mô hình là 86,1%
Bảng 4 Variables in the Equation
a Variable(s) entered on step 1: Q3.2.a, Q3.2.f, Q3.2.s, Q3.2.t.
Bảng 4 thể hiện kết quả của kiểm định Wald (kiểm định giả thuyết hồi quy khác không) Nếu hệ số hồi quy B0 và B1 đều bằng 0 thì tỷ lệ chênh lệch giữa các xác suất sẽ bằng 1, tức xác suất để sự kiện xảy ra hay không xảy ra như nhau, lúc đó mô hình hồi quy không có tác dụng dự đoán
Đối với hồi quy tuyến tính sử dụng kiểm định t để kiểm định giả thuyết H0: βk=0 Còn đối với hồi quy Binary Logistic, đại lượng Wald Chi Square được sử dụng để kiểm định ý nghĩa thống kê của hệ số hồi quy tổng thể
Kết quả bảng 4 cho thấy mức độ hài lòng về 4 dịch vụ có giá trị p (sig.) nhỏ hơn mức
ý nghĩa α = 0,05 bác bỏ H0 Như vậy các hệ số hồi quy tìm được có ý nghĩa và mô hình được sử dụng tốt
Trang 5Từ các hệ số hồi quy này ta viết được phương trình:
Diễn giải ý nghĩa của các hệ số hồi quy Binary Logistic như sau:
Mức độ hài lòng về 4 dịch vụ đều làm tăng mức độ hài lòng chung về điểm đến , trong đó hài lòng về DV lưu trú tác động mạnh nhất Cụ thể tác động biên của mức độ hài lòng về DV lưu trú lên mức độ hài lòng chung với xác suất ban đầu = 0,5 thì tác động này bằng 0,5(1-0,5)1,57 = 0,3925
VẬN DỤNG MÔ HÌNH HỒI QUY BINARY LOGISTIC CHO MỤC ĐÍCH DỰ BÁO
Mô hình hồi quy Binary Logistic có thể được áp dụng để dự báo khả năng trả nợ khi đối tượng đi vay hay dự báo nhu cầu sử dụng một sản phẩm cụ thể nào đó Ta sử dụng công thức sau: