1. Trang chủ
  2. » Thể loại khác

chuong 2_Thong pptx

54 408 6

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 54
Dung lượng 2,38 MB

Nội dung

Chương 2: Phân tích mô hình hồi qui đa biến  Khái niệm về phân tích hồi quy  Mô hình hồi qui hai biến  Phương pháp bình phương nhỏ nhất  Các giả định của mô hình hồi qui đa biến  Đ

Trang 1

Chương 2: Phân tích mô hình

hồi qui đa biến

 Khái niệm về phân tích hồi quy

 Mô hình hồi qui hai biến

 Phương pháp bình phương nhỏ nhất

 Các giả định của mô hình hồi qui đa biến

 Độ chính xác và sai số chuẩn của ước

lượng

 Kiểm định giả thuyết mô hình

 Ví dụ mô hình hồi qui đa biến

Trang 2

Khái niệm về phân tích hồi quy

 Phân tích hồi quy đề cập đến việc nghiên

cứu sự phụ thuộc của một biến số, biến phụ

thuộc, vào một hay nhiều biến số khác,

biến độc lập, với ý định ước lượng và/hoặc

dự đoán giá trị trung bình (tổng thể) của

biến phụ thuộc dựa trên những giá trị đã

biết hay cố định của biến độc lập

Trang 3

Ví dụ 1

 Chúng ta quan tâm đến việc dự báo chiều cao

trung bình của những người con khi biết chiều cao của người cha

Dùng biểu đồ phân tán để biểu diễn phân

phối chiều cao của những người con trong một tổng thể tương ứng với chiều cao của những

người cha được cho trước hay cố định

Trang 4

Hình 1.1 Phân phối giả thiết của chiều cao của những người con

trai tương ứng với chiều cao của người cha được cho trước

Giá trị trung bình

Trang 5

Ví dụ khác

 Một nhà kinh tế có thể quan tâm đến việc

nghiên cứu sự phụ thuộc của chi tiêu cá nhân vào thu nhập cá nhân sau thuế hay thu nhập

khả dụng thực tế

 Một nhà độc quyền, người có thể ấn định giá

hay sản lượng (nhưng không cả hai) có thể

muốn tìm ra phản ứng của cầu đối với sản

phẩm khi giá thay đổi Thực nghiệm này có thể

cho phép sự ước lượng hệ số co giãn theo giá

 …

Trang 6

Mô hình hồi qui hai biến

Hàm hồi qui tổng thể (population

regression function – PRF) có dạng:

E(Y/Xi) = f(Xi)

Nếu PRF có 1 biến độc lập thì được gọi là hàm

hồi qui đơn (hồi qui hai biến), nếu có từ 2

biến độc lập trở lên được gọi là hàm hồi qui bội

 Hàm hồi qui tổng thể cho biết giá trị trung

bình của biến Y sẽ thay đổi như thế nào khi biến X nhận các giá trị khác nhau

Trang 8

Một ví dụ giả thiết

giá trị của X, nhưng, một cách tổng quát,

X thì Y

đó của X đgl Giá trị kỳ vọng có điều kiện,

Giá trị kỳ vọng không có điều kiện:

E(Y) = 7273/60 = 121,20

Trang 9

9Phân phối có điều kiện của chi tiêu ứng với các mức thu nhập khác nhau

Trang 10

Hàm hồi quy tổng thể

 Đường nối các điểm tròn đen trong hình là

đường hồi quy tổng thể, biểu diễn sự hồi quy của Y vào X.

 Về mặt hình học, một đường hồi quy tổng

thể là quỹ tích các giá trị trung bình có điều kiện của biến phụ thuộc ứng với mỗi giá trị

cố định của biến giải thích

 Ứng với mỗi giá trị của X, có một tổng thể

các giá trị của Y, dao động xung quanh giá trị kỳ vọng có điều kiện của Y

Trang 11

Đường hồi quy tổng thể

Trang 12

Mô hình hồi quy tuyến tính

 Vậy kỳ vọng có điều kiện E(Y|Xi) là một

hàm số của Xi:

E(Y|Xi) = f(Xi)

 Dạng hàm f(Xi) phụ thuộc vào các mối quan

hệ kinh tế (thường được xác định dựa vào các lý thuyết kinh tế)

 Ở đây, ta thường sử dụng hàm số tuyến

tính:

Trang 13

Mô hình hồi qui hai biến

 PRF tuyến tính:

E(Y/Xi) = β1+ β2Xi

trong đó β1, β2 là các tham số chưa biết nhưng

cố định – các tham số hồi qui

 β1 là hệ số tự do, cho biết giá trị trung

bình của biến phụ thuộc Y sẽ thay đổi như thế nào khi biến X nhận giá trị 0

 β2 là hệ số góc, cho biết giá trị trung bình

của biến phụ thuộc Y sẽ thay đổi (tăng or giảm) bao nhiêu đơn vị khi giá trị của biến độc lập X tăng 1 đơn vị với điều kiện các yếu tố khác không thay đổi

Trang 14

Mô hình hồi qui hai biến

hai nghĩa: tuyến tính đối với tham số và

tuyến tính đối với biến.

- E(Y/Xi) = β1+ β2Xi2 là tuyến tính tham số

- E(Y/Xi) = β1+ β22Xi là tuyến tính biến số.

tuyến tính đối với tham số, nó có thể không

tuyến tính đối với biến.

Trang 15

Các hàm số tuyến tính đối với tham

số

Trang 16

Mô hình hồi qui hai biến

quan sát có độ lệch so với giá trị kỳ vọng.

hiệu là Yi.

Ui = Yi - E(Y/Xi)

 Yếu tố đại diện cho các biến không đưa vào

mô hình (biến không rõ, không có số liệu, ảnh hưởng quá nhỏ …)

Trang 17

Mô hình hồi qui hai biến

hệ số hồi quy của tổng thể từ hệ số hồi quy

của mẫu.

Hàm hồi qui mẫu (sample regression

function – SRF): sử dụng khi chúng ta không

thể lấy tất cả thông tin từ tổng thể mà chỉ thu thập được từ các mẫu riêng lẻ từ tổng thể.

là ước lượng điểm của β1;

là ước lượng điểm của β2;

Trang 18

Hàm hồi qui mẫu

 Dạng ngẫu nhiên của SRF:

ei là ước lượng điểm của Ui và gọi là phần

dư hay sai số ngẫu nhiên

i i

Y = β∧1+ β∧2 +

Trang 19

Hàm hồi qui mẫu SRF

Trang 20

Hàm hồi qui mẫu

 Rõ ràng, các ước lượng từ hàm hồi quy mẫu

có thể ước lượng cao hơn (overestimate)

hay ước lượng thấp hơn (underestimate) giá

trị thực của tổng thể

 Vấn đề đặt ra là SRF được xây dựng như thế

nào để càng gần βi thực càng tốt, mặc dù ta không bao giờ biết βi thực

Trang 21

Phương pháp bình phương nhỏ

nhất (OLS)

i i

i i

i

i i

i i

i

X Y

Yˆ Y

e

e Yˆ

e X

+

=

2 1

2 1

β β

β β

•Để tránh tình trạng này, ta dùng phương pháp “Bình phương nhỏ nhất”

2

β ˆ Yˆ

Trang 22

Phương pháp OLS

2 1

ˆ ( f

• Vậy để tìm giá trị cực tiểu của biểu thức trên, ta cần

đạo hàm =0

Trang 24

I Các ước lượng OLS là các ước lượng điểm, có

nghĩa là, với mẫu cho trước, mỗi ước lượng chỉ

cho biết duy nhất một giá trị của tham số của

tổng thể nghiên cứu.

II Một khi thu được các ước lượng từ mẫu, ta có thể

vẽ được đường hồi quy mẫu và đường này có

những đặc tính sau:

Trang 26

Đặc điểm của đường hồi quy mẫu

2 Giá trị ước lượng trung bình của Y bằng với

giá trị trung bình của Y quan sát

3 Giá trị trung bình của sai số ei bằng 0: e i

Trang 27

(2) Giả định 2: Các giá trị mẫu của xj được ước

lượng đúng, không có sai số (random sampling): Giá trị các biến giải thích là các

số đã được xác định

(3) Giả định 3: Kỳ vọng hoặc trung bình số học

của các sai số là bằng 0 (zero conditional mean)

E(u/xi) = 0

Trang 28

Giả định 3: E(ui/xi) = 0

Trang 30

Giả định 5: Var(u/xi) = σ2

Trang 31

Phương sai sai số không đồng nhất: var(ui|Xi) = σi2

Trang 32

Giả định của mô hình hồi qui đa

biến

(6) Giả định 6: Các sai số u từng cặp độc lập với

nhau Cov(u i , u i’ ) = E(u i u i’ ) = 0, nếu i ≠ i’

Trang 33

Giả định của mô hình hồi qui đa biến

(7) Giả định: Không có biến độc lập nào là

hằng số, và không tồn tại các mối liên hệ tuyến tính hoàn toàn chính xác giữa các

biến độc lập (no perfect multicollinearity) (8) Số quan sát n phải lớn hơn số biến độc lập (9) Mô hình hồi quy được xác định đúng đắn:

không có sai lệch về dạng mô hình.

Trang 34

Sai lệch về dạng mô hình

Trang 35

Độ chính xác hay sai số chuẩn của các ước lượng OLS

 Các giá trị của ước lượng OLS phụ thuộc

vào số liệu của mẫu Số liệu giữa các mẫu khác nhau lại khác nhau => cần đo lường

độ chính xác của các ước lượng

Ta đo lường độ chính xác bằng sai số

chuẩn (standard error – se).

Trang 36

Sai số chuẩn của các ước lượng OLS

Trong đó:

var: phương sai;

se: sai số chuẩn và

bằng công thức:

2

2 2

2

i i

i i

Trang 37

σ Sai số chuẩn của ước lượng hay còn gọi là sai số chuẩn của hồi quy

(se): nó là độ lệch giữa giá trị Y so với đường hồi quy được ước lượng

và được dùng để chỉ “Độ tin cậy

của mô hình” (goodness of fit)

Trang 38

Một số đặc điểm của phương sai

hay se của các ước lượng OLS

1 Phương sai của ước lượng β2 tỷ lệ với σ2,

nhưng nghịch biến với Σxi2 Do vậy, X biến động càng lớn, se càng nhỏ => ước lượng càng chính xác; n càng lớn, càng chính

xác

2 Phương sai của ước lượng β1 tỷ lệ với σ2 và

ΣXi2, nhưng nghịch biến với Σxi2 và cở mẫu

Trang 39

Định lý Gauss-Markov

 Một ước lượng được gọi là “ước lượng không

chệch tuyến tính tốt nhất” (BLUE) nếu thỏa các điều kiện:

 Nó là tuyến tính, có nghĩa là một hàm tuyến tính

của một biến ngẫu nhiên,

 Nó không chệch,

Nó có phương sai nhỏ nhất, hay còn gọi là ước

lượng hiệu quả (efficient estimator).

Định lý: Với những giả định của mô hình

hồi quy cổ điển, các ước lượng bình phương

bé nhất có phương sai nhỏ nhất, trong

nhóm những ước lượng tuyến tính không

chệch, tức là, chúng là BLUE

Trang 40

Hệ số xác định R2: một thước đo Độ tin cậy của mô hình

ESS

R2 = = 1 −

Trang 41

Hệ số xác định R2

thích bởi các biến số X trong mô hình.

 0 < R 2 < 1

khi số biến X đưa vào mô hình tăng, bất chấp biến đưa vào không có ý nghĩa.

 Cần sử dụng R 2 điều chỉnh (adjusted R 2 -  R 2 )

để quyết định việc đưa thêm biến vào mô

hình.

Trang 42

Hệ số xác định điều chỉnh  R2

k n

n ) R (

• Khi k > 1,  R2 < R2 Do vậy, khi số biến

X tăng,  R2 sẽ tăng ít hơn R2

• Khi đưa thêm biến vào mô hình mà làm cho  R2 tăng thì nên đưa biến vào và

ngược lại

Trang 43

Kiểm định giả thuyết mô hình

 CLRM còn giả định ui theo phân phối chuẩn:

ui ~ N(0, σ2) ⇔ Yi ~ N(β1 + β2Xi, σ2)

 Do ui theo phân phối chuẩn, các ước lượng

OLS của β1 và β2 cũng theo phân phối

Trang 44

1 Xây dựng khoảng tin cậy của β1

β2

 Để xem β 2 “gần” với β 2 đến mức nào, ta cần

tìm 2 giá trị ε và α sao cho xác suất của

Trang 45

 Biến t sẽ theo phân phối t với bậc tự do n – k

(số tham số được ước lượng kể cả hệ số tự

Trang 46

chiều hướng khác biệt của β 2 so với β 0

100(1- α ) cho β 2 Nếu giá trị β 2 trong giả

bác bỏ H0.

Trang 47

Quy tắc quyết định

Trang 48

Kiểm định giả thuyết mô hình

1 Kiểm định giả thuyết về từng phần tử

của β

Thông thường, giả thuyết được đặt ra là βi =

0, nghĩa là biến Xi không ảnh hưởng đến

mô hình, khi đó chúng ta xét:

) k n ( k

k ~ t )

ˆ ( se

ˆ

β

β

Nếu t < tα/2, (n-k): ta chấp nhận giả thuyết H0: βI = 0 ở

đến Y.

Nếu t > tα/2, (n-k): ta bác bỏ giả thuyết H0 và chấp

ảnh hưởng đến Y.

Trang 49

Kiểm định giả thuyết mô hình

2 Kiểm định ảnh hưởng tất cả các biến

k

k

n F

Trang 50

Phương pháp dự đoán trong mô hình hồi qui

2

2 2

0 2 1

11

i

o /

x

) x X

( n

s t

) X ˆ ˆ

(

Σ

−+

+

±

β

Cho trước 1 giá trị X0, ta có thể dùng mô

hình hồi quy để dự báo giá trị Y ứng với

một mức tin cậy α nào đó Công thức:

s: sai số chuẩn của ước lượng

Trang 51

Ví dụ: Có bộ số liệu về chi tiêu và thu nhập của hộ gia đình ở VN 1998 như sau:

Ta cần kiểm định mối quan hệ giữa mức chi

tiêu/đầu người với thu nhập của hộ gia đình, số nhân khẩu, số trẻ em trong gia đình.

Trang 52

Kết quả ước lượng mô hình hồi quy

F( 3, 5995) = 1116.09

Residual 2.77E+10 5995 4619197 R-squared = 0.3584

Adj R-squared = 0.358 Total 4.32E+10 5998 7195461 Root MSE = 2149.2

pcexp Coef Std Err t P>t [95% Conf Interval]

hhsize -376.468 20.22 -18.62 0.000 -416.11 -336.83 child -145.951 27.57 -5.29 0.000 -199.99 -91.91 _cons 4001.691 75.15 53.25 0.000 3854.37 4149.01

Trang 53

Trình bày Kết quả

d 145,95chil -

ze 376,47hhsi

=

rincome ,

hình giải thích được 35,8% sự biến động của chi tiêu bình quân đầu người trong hộ.

Hay ta có thể gọi các hệ số được ước lượng đều có ý nghĩa ở mức 5%.

Trang 54

Trình bày và giải thích Kết quả

d 145,95chil -

ze 376,47hhsi

=

rincome ,

• Khi thu nhập tăng thêm 1 đồng, chi tiêu đầu người

tăng bình quân 0,082 đồng, trong điều kiện các yếu tố khác không đổi.

• Khi số nhân khẩu trong gia đình tăng thêm 1 người,

chi tiêu đầu người giảm bình quân 376.000 đồng,

trong điều kiện các yếu tố khác không đổi.

• Khi số trẻ em trong gia đình tăng thêm 1, chi tiêu

Ngày đăng: 22/06/2014, 12:20

HÌNH ẢNH LIÊN QUAN

Hình 1.1 Phân phối giả thiết của chiều cao của những người con - chuong 2_Thong pptx
Hình 1.1 Phân phối giả thiết của chiều cao của những người con (Trang 4)
Hình hồi quy để dự báo giá trị Y ứng với - chuong 2_Thong pptx
Hình h ồi quy để dự báo giá trị Y ứng với (Trang 50)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w