Kết cấu chương 4 Hồi qui logistic thuộc bài giảng Kinh tế lượng trình bày về các nội dung lần lượt như sau: hồi qui của một biến lưỡng phân, tỷ lệ (odds), mô hình logistic, ước lượng của mô hình, tỷ số tỉ lệ Odds ratio, thiết lập mô hình thứ nhất.
Trang 1Hồi qui logistic
Trang 3Hồi qui của một biến lưỡng phân
Xem xét mối liên hệ :
Thành công hoặc thất bại của một doanh
nghiệp mới (y) với các đặc điểm của chủ doanh nghiệp :
Tuổi (x1)
Năm kinh nghiệm (x2)
Học vấn (x3)
Trang 4Thiết lập mô hình thứ nhất
y=0 nếu thất bại
Trang 5Các vấn đề
sai số của mô hình (error) không được tôn trọng.
phương sai không giống nhau của các sai số của
đến 1 Hàm hồi qui không thể đảm bảo điều đó
Trang 7Tỉ lệ (Odds)
xác suất không quan sát nó
) E (
P oddsE
4 2
, 0
8 ,
0 )
S ( P 1
) S (
P
Trang 9x x
x
exp )
1 y
( P )
y (
E
b b
b
b
b b
Trang 10P y
E
b b
b b
1 0
1 0
exp1
exp)
1(
Trang 12Hồi qui logistic
là 0 và 1 mà ta cần giải thích bằng 3 biến độc lập liên tục x1, x2 và x3
Có một biến ngầm (cơ bản) y* không thể quan sát được
như sau đây :
y=1 với y*>0
y=0 nếu y*<=0
b
b
b
b
* y
tiếp
Trang 13Hồi qui logistic
) (
) 1 (
) (
1 )
1 (
) (
) 1 (
) 0 (
) 1 (
3 3 2
2 1
1 0
3 3 2
2 1
1 0
3 3 2
2 1
1 0
3 3 2
2 1
1 0
x x
x F
y
P
x x
x F
y
P
x x
x P
y
P
x x
x P
y
P
b b
b b
b b
b b
b b
b b
b
b b
Trang 14Hồi qui logistic
tiếp
Hàm logistic (Mô hình logit)
Hàm tích lũy của luật phân phối chuẩn (mô hình probit)
3 3 2
2 1
1 0
x x
x exp
1
x x
x
exp )
1 y
(
P
b b
b
b
b b
P b b b b
3 3 2
2 1
1 0
) 1 (
1
) 1
(
Y P
Y
P
b b
Trang 15phải là giá trị làm cực đại xác suất đạt được các giá trị quan sát trên X.
Trang 16Cực đại hàm hợp lý
FV()=f(X1;)xf(X2;)x…xf(Xn;)
Nếu X là một biến rời rạc, FV() là tích các xác suất
Nếu X là một biến liên tục, FV() là tích các hàm mật độ xác suất
FV() đạt cực đại với giá trị của khi giá trị này bỏ đạo hàm bậc nhất
Trang 17Cực đại hàm hợp lý
logarít của FV() khi nó có dạng là một tổng hàm của sẽ tiện lợi hơn khi FV() là một tích.
ta gọi là hàm logarit hợp lý
Trang 18Cực đại hàm hợp lý
et 2
Ta có một mẫu với n quan sát X1, X2, …, Xn
tiếp
2
2 ( ) 2
1
2
1 )
Trang 192
1 )
X
n n
e X
f
2
2 ( ) 2
1
1
2
2
1 )
( )
Trang 202
)
( 2
1 2
1 log
) (
log )
L
X X
f L
1
2 4
2 2
2
1 2 1
2
0 )
( 2
2
) ,
(
0 )
(
1 )
( log
) ,
Trang 21X n
1
2 2
1
) (
1 ˆ
1 ˆ
Trang 22Ví dụ
Trong 700 người vay tiền ngân hàng, ta có
thông tin sau :
không khó khăn (0)
(employ)
Trang 23Ví dụ
tiếp
Trang 24Ví dụ
tiếp
Trang 25Ước lượng tổng quát của mô hình
phép logarit lặp lại nhiều lần dựa trên phương
Omnibus Tests of Model Coefficients
173,282 2 ,000 173,282 2 ,000 173,282 2 ,000
Step Block Model Step 1
Chi-square df Sig.
Trang 26Ước lượng tổng quát của mô hình
-2 Log likelihood
Cox & Snell
Trang 27Lợi ích của mô hình
The cut value is ,500
a
Trang 28Lợi ích của mô hình
tiếp
Một điều chỉnh tốt giữa các giá trị dự đoán
và các giá trị thực tế được chỉ ra ra bởi một
hệ số c2 không có nghĩa
Hosmer and Lemeshow Test
4,158 8 ,843
Step 1
Chi-square df Sig.
Trang 29 như vậy, trong ví dụ về lớp « không khó khăn »; phần trăm các quan sát được phân lớp rõ ràng sẽ
là :(517/700)x100=73.93%
cốt là xem rằng chúng ta sử dụng tất cả các quansát một cách ngẫu nhiên
như vậy, phần trăm các quan sát được sắp xếp rõràng sẽ là:
Trang 30p=tỉ lệ các quan sát được phân lớp rõ ràng
p0=tỉ lệ các quan sát được phân lớp rõ ràng theo tiêu chí cực đại các cơ hội
Các dự đoán có ý nghĩa tốt nhất khi sử dụng ở nhóm có kích thước lớn hơn (giá trị tới hạn của z với mức 1%=2.05)
n
p 1 p
p p z
0 0
Trang 31Press de
Q
Trang 32Ý nghĩa của các hệ số
Kiểm định mức ý nghĩa của các hệ số được
thực hiện dựa vào phép tính c2 cụ thể với 1 bậc tự do, c2 của Wald
c2 này kiểm định giả thiết không :
H0: bi=0 cho mỗi hệ số
Cả hai hệ số này có ý nghĩa
Variable s in the Equation
-,141 ,019 53,755 1 ,000 ,868 ,145 ,016 87,231 1 ,000 1,156 -1,693 ,219 59,771 1 ,000 ,184
employ dette Constant
Step
1a
B S.E Wald df Sig Exp(B)
Variable(s) entered on step 1: employ, dette.
a
Trang 33Diễn giải các hệ số
Đối loga (antilog) cuả hệ số bi ước lượng sự thay đổi trong
tỉ lệ (odds) quan sát y=1 khi xi tăng lên 1 đơn vị, mọi thứ đều như nhau
Thông thường, ta tính (ebi)-1, chỉ tiêu này chỉ ra phần trăm
biến thiên trong tỉ lệ (odds) Các giá trị dương cho thấy
một sự tăng lên trong tỉ lệ Như vậy các giá trị âm cho thấy
Trang 34Quay lại các bảng chéo
Giao nhau giữa loại công việc (nhà quản lý=1 nghề khác=0)
và giới tính (nam giới=1 phụ nữ=0)
EMPLOI * SEXE2 Crosstabulation
Trang 35Tỷ số tỉ lệ (Odds ratio)
0 258
74 1
10 1
216
10
Trang 36Hồi qui logistic
Omnibus Tests of Model Coefficients
Step Block Model
Cox & Snell
R Square
Nagelkerke
R Square
Trang 37Constant is included in the model.
SEXE2
Constant
Step
1a
B S.E Wald df Sig Exp(B)
Variable(s) entered on step 1: SEXE2.
a
Trang 38Các biến độc lập lưỡng phân
Đối loga (antiloga) của hệ số bi cho ta chỉ số tỉ lệ, có nghĩa
là, có khả năng biến phụ thuộc nhận giá trị 1 nhiều hơn giá trị 0 nếu biến độc lập cũng nhận giá trị 1 so với trường hợp
mà nó đáng lẽ nhận giá trị 0
Trang 39Y ln
Y b