Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 61 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
61
Dung lượng
1,45 MB
Nội dung
ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH Các nội dung Kiểm tra giả thiết áp dụng mô hình Số liệu quan sát sai lệch Các biến giả (dummy) Phương pháp bước Sự tương tác (Interaction) Các điều kiện vận dụng mô hình Các điều kiện dạng mô hình : Các điều kiện sai số mô hình (error): Các sai số mô hình độc lập (không tự tương quan) phân phối giống theo phân phối chuẩn với trung bình variance σ2 (homoscedasticity) Các điều kiện số dự đoán: Tuyến tính biến độc lập so với biến phụ thuộc Các biến độc lập không Các giá trị biến có sai số Các số dự đoán độc có bội tương quan multicollinearity) ngẫu nhiên độc lập đo lường không lập theo đường thẳng, (không biến độc lập - Các điều kiện quan sát: Tất quan sát có vai trò Mô hình với ảnh hưởng cố định ngược với mô hình với ảnh hưởng ngẫu nhiên Về nguyên tắc, hồi qui thực mô hình có ảnh hưởng cố định Các biến độc lập kiểm soát Mô hình hoạt động biến có ảnh hưởng ngẫu nhiên Các biến độc lập ngẫu nhiên Về nguyên tắc, biến phải tuân theo phân phối chuẩn đa biến Tuyến tính Vẽ biểu đồ phần (partial plots) Để đánh giá đặc trưng tuyến tính biến Xj so với Y, hồi qui Y toàn biến độc lập trừ Xj, hồi qui Xj biến độc lập khác Chúng ta vẽ biểu đồ phần dư (residues) hai hồi qui. Như vậy, loại bỏ ảnh hưởng biến độc lập khác. Tuyến tính tiếp Partial Regression Plot Dependent Variable: prix 200000 100000 prix -100000 -200000 -2000 surface -1000 1000 2000 3000 Tuyến tính tiếp Partial Regression Plot Dependent Variable: prix 200000 100000 prix -100000 -200000 -20 age 20 40 60 80 Biểu đồ phần dư (residues) Scatterplot Dependent Variable: prix Regression Studentized Residual -2 -4 100000 200000 300000 Regression Adjusted (Press) Predicted Value 400000 Biểu đồ (histogram) phần dư (residues) Histogram Dependent Variable: prix 60 50 40 30 Frequency 20 Std. Dev = 1,00 10 Mean = 0,00 N = 319,00 Regression Standardized Residual Normal probability plot (Đồ thị theo hàm chuẩn) Normal P-P Plot of Regression Standardized Residual Dependent Variable: prix 1,00 Expected Cum Prob ,75 ,50 ,25 0,00 0,00 ,25 ,50 ,75 1,00 Observed Cum Prob 10 [...]... biến Các điều kiện vận dụng mô hình thường xuyên không đạt được: Tuyến tính Phương sai không đổi của các sai số (errors) của mô hình Một mô hình là tuyến tính nếu các tham số hiện diện trong mô hình là tuyến tính, ngay cả khi các biến độc lập không tuyến tính 12 • Thống kê JB1 Đây là một thống kê thường được sử dụng để kiểm... biến tiếp Các ví dụ của các mô hình tuyến tính: Y = β1 + β 2 X + ε 2 Y = β1 + β 2 X + β 3 X + ε Y = β1 + β 2 log X + ε YVí dụ1 mô hình không tuyến tính: = β + β2 X + ε Y = β1 + e β2 X +ε 15 Các phép biến đổi để làm cho mô hình tuyến tính β Hàm Y = αX Phép biến đổi Y ' = log Y , X ' = log X Dạng tuyến tính Y ' = log α + βX ' 16 Các phép biến đổi để làm cho tiếp mô hình tuyến tính βX Hàm... tính' = ln α + β X Y 17 Các phép biến đổi để làm cho tiếp mô hình tuyến tính Hàm Phép biến đổi Dạng tuyến tính Y = α + β log X X ' = log X Y = α + βX ' 18 Các phép biến đổi để làm cho tiếp mô hình tuyến tính Hàm Phép biến đổi Dạng tuyến tính X Y= αX − β 1 1 Y' = , X ' = Y X Y ' = α − βX ' 19 Các phép biến đổi để làm cho tiếp mô hình tuyến tính Hàm Phép biến đổi Dạng tuyến tính Y=... thống kê này rất quan trọng cho việc kiểm định phần dư của mô hình hồi theo phương pháp OLS có phân phối chuẩn hay không Giả thiết H0: Chuỗi (biến) có phân phối chuẩn Công thức: ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡− + − = 4 )3K( S 6 k N JB 2 2 (2.1) Trong đó, S là độ nghiêng của phân phối, K là độ nhọn của phân phối, N là số quan sát, và k là số hệ số lượng được sử dụng để tạo ra chuỗi dữ liệu (N-k là bậc tự do) 2 Khi một... khoảng không (trên đồ thị) của các biến độc lập 25 Studentized Deleted Residuals ti * t = * i e( i ) e( i ) S( i ) 1 − hi ˆ : Chênh lệch giữa Yi và Yi dựa trên mô hình chứa đựng tất cả các quan sát , trừ i S( i ) : dạng lỗi đối với mô hình chứa đựng tất cả các quan sát, trừ i Một quan sát được xem như lệch lạc nếu ti* > t n − p − 2 tn−p −2 là giá trị phê phán đối với kiểm định hai bên ở mức rủi... Nói chung được sử dụng đế thiết lập một nhân tố kiểm soát Các ví dụ: nam-nữ, có mặt – vắng mặt do một điều kiện cụ thể Được mã hóa 0 hoặc 1 Về mặt lý thuyết, các hằng số (hệ số chặn) phải khác nhau Giả sử rằng, có cùng hệ số hồi qui với mỗi một loại Số các biến giả cần thiết là số loại trừ (-) 1 33 Biến giả (dummy) tiếp ˆ Yi = b0 + b1 X 1i + b2 X 2i Y = tiền lương X1 = Số năm kinh nghiệm 0 nữ... values) Những quan sát cho thấy ảnh hưởng (influential) Được đánh dấu bằng các giá trị của ma trận mũ (hat values) Sự hủy bỏ của các quan sát này nói chung làm thay đổi quan trọng ước lượng các tham số của mô hình Được đánh dấu bằng các khoảng cách Cook Những quan sát lệch lạc (outliers): Những quan sát mà đối với nó, biến phụ thuộc có một giá trị “không bình thường” (anormal) so với các... nhau b0 Nữ X1 (giới tính) 35 Diễn giải hệ số của biến giả Ví dụ: ˆ Yi = b0 + b1 X 1i + b2 X 2i = 20 + 5 X 1i + 6 X 2i Y: tiền lương năm tính bằng triệu đô la X 1 : kinh nghiệm X 2 : 0 nữ 1 nam Trung bình, nam thu nhập năm trên 6000$, các điều kiện khác không đổi 36 ... chỉ ra trong chừng mực nào Yi có thể ảnh hưởng đến Nếu hij là lớn, quan sát thứ ième có thể có một ảnh hưởng quan trọng đến giá trị được điều chỉnh thứ jème 2 Chúng ta có thể chứng tỏ rằng ii ij j hj=hjj tóm lược ảnh hưởng tiềm tàng của yi đến tất cả các giá trị được điều chỉnh ˆ Yj h = ∑h 24 Các yếu tố của ma trận mũ “hat matrix” hi tiếp Các giá trị nằm giữa 0 và 1 và giá trị trung bình bằng (k)/n... quan sát thứ i Nếu Di>4/(n-k), quan sát được xem như có ảnh hưởng (trong ví dụ, 4/316=0,013) 27 Những quan sát sai lệch (outliers) tiếp Phải làm gì với các giá trị sai lệch ? Rút ra khỏi mẫu, với điều kiện có thể chứng minh được 28 Những quan sát sai lệch (outliers) tiếp 29 Những quan sát sai lệch (outliers) tiếp a Residuals St at ist ics Predicted Value Std Predicted Value Standard Error of Predicted . (Interaction) 3 Các điều kiện vận dụng mô hình Các điều kiện về dạng mô hình : Tuyến tính của các biến độc lập so với biến phụ thuộc Các điều kiện về sai số mô hình (error): Các sai số mô hình là. 5% JB n 6 skewness =Z n 24 kurtose =Z 12 Phép biến đổi các biến Các điều kiện vận dụng mô hình thường xuyên không đạt được: Tuyến tính Phương sai không đổi của các sai số (errors) của mô hình Một mô hình là tuyến tính nếu các. 1 ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH 2 Các nội dung chính Kiểm tra các giả thiết áp dụng mô hình Số liệu quan sát sai lệch Các biến giả (dummy) Phương