DIỄN ĐÀN SINH VIÊN THƯƠNG MẠI – SVTM.VN Vài Vấn Đề Chính Trong Thực Hành E-View MỤC LỤC (Bấm giữ Ctrl rồi bấm vào mục cần xem để đến nhanh mục đó) MỤC LỤC 1 Xem Đồ Thị: 2 Chạy Mô Hình Và Cách Đọc Mô Hình 2 Kiểm định tham số 4 Kiểm định sự phù hợp của mô hình hồi quy 4 Tìm khoảng ước lượng (khoảng tin cậy) cho các tham số: 4 Dự báo giá trị trung bình và giá trị cá biệt của Y0 khi biết X0 4 Mô hình hồi quy có biến giả 6 Cách phát hiện đa cộng tuyến 7 Kiểm tra phương sai thay đổi 8 Kiểm tra tự tương quan 8 Kiểm định loại bỏ các biến không cần thiết 9 1 DIỄN ĐÀN SINH VIÊN THƯƠNG MẠI – SVTM.VN Xem Đồ Thị: Vào Quick > Show, trong cửa sổ hiện ra gõ tên các biến có trong mô hình vào rồi bấm OK. Tiếp theo vào: View -> Graph -> Scatter -> Simple Scatter: Đồ thị phân tán. View -> Graph -> Scatter -> Scatter with Regression: Đồ thị phân tán có đường hồi quy. Chạy Mô Hình Và Cách Đọc Mô Hình. Chạy mô hình Để chạy mô hình hồi quy, ta bấm giữ nút Ctrl trên bàn phím và chọn các biến trong mô hình (trong ví dụ này là biến Y và biến X), lưu ý là phải chọn biến phụ thuộc đầu tiên (Y), xong bấm phải chọn Open > as Equation… Sau khi bấm OK, bảng kết quả hồi quy sẽ hiện ra như sau (đã loại bỏ những dòng không cần thiết): 2 DIỄN ĐÀN SINH VIÊN THƯƠNG MẠI – SVTM.VN Cách đọc kết quả như sau: Dependent Variable: biến phụ thuộc (nếu mà không phải là Y thì bạn bị sai rồi) Inclued observations: số quan sát Variable: tên các biến độc lập trong mô hình trong đó C là hệ số tự do (β1) Coefficient: Giá trị ước lượng của tham số, trong hình 1=0.154206 và 2=-0.000645. Ý nghĩa như sau 1=0.154206 là giá trị của Y khi X=0, 2=-0.000645 là mức độ giảm của Y khi X tăng 1 đơn vị. Std. Error: độ lệch (sai số) tiêu chuẩn (còn gọi là se, như ở hình trên se( 1) = 0.176299 và se( 2) = 0.002403 t-Statistic: kiểm định t cho các biến số, tham số. Prob: p-value của các biến số, tham số. R-squared: hệ số xác định R 2 . R 2 là tỷ lệ phần biến động của Y được giải thích từ X, là sự phụ thuộc của Y vào X, mức độ giải thích của X cho Y. Adjusted: R-squared: Hệ số R 2 hiệu chỉnh, để cân nhắc khi xem xét việc đưa thêm biến giải thích mới vào mô hình (nếu bạn cảm thấy một X chưa đủ giải thích) S.E. of regession: ước lượng của σ F-statistic: Kiểm định F cho hệ số R 2 , dùng để kiểm nghiệm xem R 2 có ý nghĩa thực sự hay không (R 2 có bằng 0 hay không) Prob(F-statistic): p-value(F), dùng để kiểm nghiệm xem R 2 có ý nghĩa thực sự hay không (R 2 có bằng 0 hay không) 3 DIỄN ĐÀN SINH VIÊN THƯƠNG MẠI – SVTM.VN Kiểm định tham số Kiểm định tham số nghĩa là kiểm tra xem các hệ số hồi quy có có ý nghĩa thống kê hay không, nói cách khác là chúng có khác 0 hay không. Giả sử mô hình của ta sẽ có hình thức như thế này: Y = β 1 + β 2 X. Trong đó, Y là biến phụ thuộc, X là biến độc lập, β 1 là hệ số tự do, β 2 là hệ số góc. Nếu β 2 = 0 thì X không ảnh hưởng đến Y. Đặt giả thiết H 0 : β 2 =0 (hệ số không có ý nghĩa thống kê), H 1 : β 2 0 Nếu |t kd | , bác bỏ H 0 Nếu p-value , bác bỏ H 0 Người ta thường đặt H 0 trái với giả thiết cần kiểm chứng. Kiểm định sự phù hợp của mô hình hồi quy Kiểm định sự phù hợp của mô hình là kiểm định hệ số R 2 có khác 0 một cách có ý nghĩa thống kê hay không. Đặt giả thiết H 0 : R 2 =0 (X hoàn toàn không giải thích được cho Y, các βj đồng thời bằng 0) và H 1 : R 2 0 Nếu F kd > , bác bỏ H 0 Nếu p-value(F) < λ, bác bỏ H 0 Tìm khoảng ước lượng (khoảng tin cậy) cho các tham số: Công thức: j Se( βj j Se( Trong công thức ta lấy ví dụ cho α=5%, (n-k=12-2=10) =2.228 ta có, dùng số liệu hình phía trên ta có: Khoảng ước lượng β1: 0.154206 – 2.228 x 0.176299 β 1 0.154206 + 2.228 x 0.176299 Khoảng ước lượng β2: -0.000645 – 2.228 x 0.002403 β 2 -0.000645 + 2.228 x 0.002403 Dự báo giá trị trung bình và giá trị cá biệt của Y 0 khi biết X 0 Bạn cần phải nhớ 3 công thức sau: Công thức 1: dự báo giá trị cá biệt 4 DIỄN ĐÀN SINH VIÊN THƯƠNG MẠI – SVTM.VN 0 – se(Y 0 - 0 ) ≤ Y 0 ≤ 0 – x se(Y 0 - 0 ) Công thức 2: dự báo giá trị trung bình 0 – Se( 0 ) ≤ Y 0 ≤ 0 – x se( 0 ) Công thức 3: mối quan hệ giữa se(Y 0 - 0 ) và se( 0 ) se( 0 ) = (Trong đó là giá trị S.E. of regression trong bảng kết quả chạy mô hình hồi quy) Nhập thêm giá trị X 0 vào dữ liệu đã có như sau: từ cửa sổ Workfile chọn Proc > Structure/Resize Current Page, cửa sổ Workfile structure sẽ hiện ra bạn tăng số quan sát thêm 1, bấm OK, bấm tiếp Yes. Trở về cửa sổ Workfile bạn mở biến cần thêm dữ liệu (giả sử là X 1 ) và ghi số liệu đề bài cho vào. Bây giờ bạn bắt đầu tìm 0 và se(Y 0 - 0 ) như sau: Từ cửa sổ Equation chọn Forecast, một cửa sổ sẽ hiện ra (xem hình phía dưới, phía trong hình chữ nhật màu đỏ Forecast chính là 0 , S.E. (optional) chính là se(Y 0 - 0 ), bạn gõ tên cho 2 giá trị này vào 2 ô bên cạnh sao cho dễ nhớ, vì bạn sẽ phải nhớ tên này để sử dụng trong các bước tiếp theo) > bấm OK. 5 DIỄN ĐÀN SINH VIÊN THƯƠNG MẠI – SVTM.VN Đến lúc này, bạn đã có thêm 2 biến nữa mới xuất hiện ở cửa sổ Workfile là Yo^ và se(Yo – Yo^), như vậy bạn đã có thể hoàn thành công thức 1, tuy nhiên để hoàn thành công thức 2 bạn cần có thêm biến se( 0 ), cách tính biến này bạn dùng công thức 3. Để tạo thêm biến se( 0 ), tại cửa sổ Workfile bạn bấm vào nút Genr phía trên, trong cửa sổ hiện ra, bạn nhập công thức 3 vào ô Enter equation (lưu ý nhập chính xác tên đã đặt ở trên), bấm OK. Vậy là bạn đã có đủ dữ kiện để thực hiện công thức 1 và công thức 2. Mình xin làm ví dụ công thức 1 (dự báo Y cá biệt) giả sử : Bấm Genr gõ vào công thức minYcb=Yo^ – *se(Yo-Yo^), bấm OK > biến minYcb sẽ xuất hiện, chính là giá trị Y cá biệt dự báo nhỏ nhất. Bấm Genr gõ vào công thức maxYcb=Yo^ + *se(Yo-Yo^), bấm OK > biến maxYcb sẽ xuất hiện, chính là giá trị Y cá biệt dự báo lớn nhất. Tương tự bạn thực hiện công thức 2. Mô hình hồi quy có biến giả Cho mô hình ví dụ: Y là mức lương của giáo viên X là số năm làm việc D=0 nếu là cử nhân, D=1 nếu là thạc sĩ Ta có mô hình hồi quy như sau: Y = α 0 +α 1 D + β 0 X + β 1 (D.X) + U Ý nghĩa của các tham số hồi quy như sau: α 0 : lương khởi điểm của giáo viên có bằng cử nhân α 1 : chênh lệch về lương khửi điểm của giáo viên có bằng thạc sĩ với bằng cử nhân 6 DIỄN ĐÀN SINH VIÊN THƯƠNG MẠI – SVTM.VN β 0 : mức thay đổi tiền lương của giáo viên có bằng cử nhân theo số năm giảng dạy β 1 : chênh lệch về mức thay đổi tiền lương theo số năm giảng dạy của giáo viên có bằng thạc sĩ so với bằng cử nhân Cách phát hiện đa cộng tuyến Trước hết phải hiểu đa cộng tuyến là gì đã: Hiểu nôm na, đa cộng tuyến là hiện tượng các biến độc lập (X) có ảnh hưởng lẫn nhau, hay còn gọi là có sự tương quan với nhau. Có 3 cách phát hiện đa cộng tuyến: 1. Hệ số R 2 cao, nhưng tỷ số t-statistic thấp: khi R 2 cao, kinh nghiệm cho thấy nếu R 2 > 0,8 thì giả thiết các hệ số hồi quy đồng thời bằng 0 bị bác bỏ. Tuy nhiên tỷ số |t| thấp thì ta chấp nhận giả thiết các hệ số hồi quy bằng 0. Khi mâu thuẫn này xảy ra, người ta thường nghĩ đến hiện tượng đa cộng tuyến. 2. Hệ số tương quan giữa các biến độc lập cao, nếu > 0,8 thì có thể chắc chắn có đa cộng tuyến. Để xem hệ số tương quan, bạn quét chọn các biến độc có trong mô hình (Xj), tiếp theo vào menu Quick > Group Statistics > Correlations > OK. 3. Chạy mô hình phụ: Về mặt lý thuyết, giả sử có mô hình hồi quy như sau: Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + U. Ta ước lượng mô hình hồi quy phụ giữa biến độc lập X với các biến độc lập còn lại có dạng: X 1 = α 0 + α 1 X 2 + α 2 X 3 + U. Để kiểm tra đa cộng tuyến ta dùng phương pháp kiểm định tham số để kiểm tra sự ảnh hưởng của biến X 2 và X 3 đến X 1 . Trong Eview, xem lại phần chạy mô hình, ta biết rằng để chạy mô hình hồi quy trước tiên bạn phải chọn các biến có trong mô hình và phải chọn biến phụ thuộc đầu tiên (thường là Y). Tuy nhiên, với mô hình phụ, biến đầu tiên bạn chọn là biến độc lập bất kì (Xj), như vậy Xj lúc này đóng vai trò như biến phụ thuộc. Giả sử ở đây mình chọn là X 1 (bấm giữ Ctrl rồi chọn lần lượt X1, sau đó mới chọn mấy cái X còn lại, ở đây mình chỉ có X 2 thôi, tiếp tục bấm phải chọn Open as Equation) kết quả thế này:. 7 DIỄN ĐÀN SINH VIÊN THƯƠNG MẠI – SVTM.VN Nghĩa là mô hình của bạn lúc này sẽ có dạng X 1 = β 1 + β 2 X 2 Bây giờ bạn chỉ việc kiểm định xem X 2 có ảnh hưởng đến X 1 hay không, nếu có là có đa cộng tuyến (xem lại phần “kiểm định tham số”) Kiểm tra phương sai thay đổi Để kiểm tra phương sai thay đổi bạn dùng kiểm định White, từ cửa sổ Equation (cửa sổ mô hình hồi quy ấy) chọn View > Residual Tests > White Heteroskedasticity (cross terms) > OK. Một cửa sổ như thế này sẽ hiện ra: Với giả thiết H 0 : phương sai không đổi. Nếu Obs*R-Squared > (df), bác bỏ H 0 , phương sai có thay đổi Nếu p-value (Probability) < α, bác bỏ H 0 , phương sai có thay đổi. Kiểm tra tự tương quan Để kiểm tra phương sai thay đổi bạn dùng kiểm định BG (Breusch-Godfrey), từ cửa sổ Equation chọn View > Residual Tests > Serial Correlation LM Test, bấm OK 8 DIỄN ĐÀN SINH VIÊN THƯƠNG MẠI – SVTM.VN Đặt giả thiết, H 0 : không có tự tương quan. Nếu Obs*R-Squared > (df), bác bỏ H 0 , hay thừa nhận có tự tương quan. Nếu p-value (Probability) > α, chấp nhận H 0 , hay không có tự tương quan. Kiểm định loại bỏ các biến không cần thiết Nếu đề bài chỉ yêu cầu kiểm tra sự cần thiết của 1 biến, bạn chỉ cần dùng phương pháp kiểm định tham số ở phần “kiểm định tham số” Nếu đề bài yêu cầu kiểm tra sự cần thiết của 2 biến trở lên, ta sử dụng kiểm định Wald cho trường hợp này. Từ cửa sổ Equation chọn View > Coefficient Tests > Wald - Coefficient Restrictions và một cửa sổ sẽ hiện ra như sau: Bạn nhập giả thiết cần kiểm tra vào đây, ví dụ “C(2)=0” (kiểm tra biến X1 có bằng 0 hay không), bấm OK. Kết quả sẽ hiện ra như sau: Nếu F-statistic > F(m,n-k) thì bác bỏ giả thiết (m là số biến muốn loại, n là số quan sát, k là số biến) Nếu p-value < α, bác bỏ giả thiết 9 DIỄN ĐÀN SINH VIÊN THƯƠNG MẠI – SVTM.VN Chú ý, với mô hình hồi quy có dạng sau: Y = β 1 + β 2 X 1 + β 3 X 2 + β 4 X 3 thì β 1 là C(0), β 2 là C(1), β 3 là C(2) và β 4 là C(3). 10 . Thị: 2 Chạy Mô Hình Và Cách Đọc Mô Hình 2 Kiểm định tham số 4 Kiểm định sự phù hợp của mô hình hồi quy 4 Tìm khoảng ước lượng (khoảng tin cậy) cho các tham số: 4 Dự báo giá trị trung bình và giá. H 0 Người ta thường đặt H 0 trái với giả thiết cần kiểm chứng. Kiểm định sự phù hợp của mô hình hồi quy Kiểm định sự phù hợp của mô hình là kiểm định hệ số R 2 có khác 0 một cách có ý nghĩa thống. ước lượng (khoảng tin cậy) cho các tham số: Công thức: j Se( βj j Se( Trong công thức ta lấy ví dụ cho α=5%, (n-k=12-2=10) =2.228 ta có, dùng số liệu hình phía trên ta có: Khoảng ước lượng