1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài giảng Phân tích dữ liệu và dự báo: Chương 3 Trường ĐH Quy Nhơn

30 8 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Bài giảng Phân tích dữ liệu và dự báo: Chương 3 Phương pháp phân tích hồi quy, cung cấp cho người đọc những kiến thức như: Mô hình hồi quy đơn; Mô hình hồi quy bội; Suy diễn thống kê và dự báo; Ước lượng khoảng tin cậy; Kiểm định giả thuyết thống kê; Dự báo từ mô hình hồi quy. Mời các bạn cùng tham khảo Đề tài Hoàn thiện công tác quản trị nhân sự tại Công ty TNHH Mộc Khải Tuyên được nghiên cứu nhằm giúp công ty TNHH Mộc Khải Tuyên làm rõ được thực trạng công tác quản trị nhân sự trong công ty như thế nào từ đó đề ra các giải pháp giúp công ty hoàn thiện công tác quản trị nhân sự tốt hơn trong thời gian tới.

CHƯƠNG PHƯƠNG PHÁP PHÂN TÍCH HỒI QUY Hiểu rõ vấn đề phân tích hồi quy Áp dụng dụng mơ hình hồi quy để dự báo nhằm hỗ trợ cho việc định Sử dụng phần mềm Eviews để ước lượng, kiểm định dự báo từ mơ hình hồi quy PHƯƠNG PHÁP PHÂN TÍCH HỒI QUY Mơ hình hồi quy đơn Mơ hình hồi quy bội Suy diễn thống kê dự báo • Ước lượng khoảng tin cậy • Kiểm định giả thuyết thống kê • Dự báo từ mơ hình hồi quy MƠ HÌNH HỒI QUY TUYẾN TÍNH Mơ hình hồi quy tuyến tính 𝑘𝑘 biến 𝑌𝑌𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑡𝑡 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑘𝑘𝑡𝑡 + 𝑢𝑢𝑡𝑡 Với giả thiết 𝐸𝐸(𝑢𝑢𝑡𝑡 |𝑋𝑋2𝑡𝑡 , … , 𝑋𝑋𝑘𝑘𝑡𝑡 ) = Khi 𝐸𝐸 𝑌𝑌𝑡𝑡 𝑋𝑋2𝑡𝑡 , … , 𝑋𝑋𝑘𝑘𝑘𝑘 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑡𝑡 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑘𝑘𝑘𝑘 gọi hàm hồi quy tổng thể 𝑌𝑌𝑡𝑡 : biến phụ thuộc (biến giải thích) 𝑋𝑋2𝑡𝑡 , … , 𝑋𝑋𝑘𝑘𝑡𝑡 : biến độc lập (biến giải thích) 𝛽𝛽1 , 𝛽𝛽2 , … , 𝛽𝛽𝑘𝑘 : hệ số hồi quy; 𝑢𝑢𝑡𝑡 : sai số ngẫu nhiên (hay nhiễu) MƠ HÌNH HỒI QUY TUYẾN TÍNH (tt) 𝐸𝐸 𝑌𝑌𝑡𝑡 𝑋𝑋2𝑡𝑡 , … , 𝑋𝑋𝑘𝑘𝑘𝑘 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑡𝑡 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑘𝑘𝑘𝑘 + 𝛽𝛽1 : hệ số chặn: giá trị trung bình biến phụ thuộc tất biến độc lập + 𝛽𝛽𝑗𝑗 (𝑗𝑗 = 2, … , 𝑘𝑘): hệ số hồi quy riêng biến 𝑋𝑋𝑗𝑗 , 𝑋𝑋𝑗𝑗 tăng (giảm) đơn vị trung bình biến phụ thuộc thay đổi 𝛽𝛽𝑗𝑗 đơn vị điều kiện yếu tố khác không đổi - Trong thực tế, hệ số hồi quy thường nên ta ước lượng chúng phương pháp bình phương nhỏ thông thường (OLS – Ordinary Least Squares) thông qua mẫu MƠ HÌNH HỒI QUY TUYẾN TÍNH (tt) Phương pháp OLS để ước lượng hệ số hồi quy từ mẫu kích thước n mơ hình hồi quy tuyến tính hai biến 𝑛𝑛∑𝑌𝑌𝑡𝑡 𝑋𝑋𝑡𝑡 − ∑𝑋𝑋𝑡𝑡 ∑𝑌𝑌𝑡𝑡 ∑𝑥𝑥𝑡𝑡 𝑦𝑦𝑡𝑡 𝛽𝛽̂2 = = 2 n∑𝑋𝑋𝑡𝑡 − ∑𝑋𝑋𝑡𝑡 ∑𝑥𝑥𝑡𝑡2 Với ∑𝑋𝑋t2 ∑𝑌𝑌𝑡𝑡 − ∑𝑋𝑋𝑡𝑡 ∑(𝑋𝑋𝑡𝑡 𝑌𝑌𝑡𝑡 ) � − 𝛽𝛽̂2 𝑋𝑋� = 𝑌𝑌 𝛽𝛽̂1 = n∑𝑋𝑋𝑡𝑡2 − ∑𝑋𝑋𝑡𝑡 𝑛𝑛 𝑛𝑛 � � � 𝑦𝑦𝑡𝑡 = 𝑌𝑌𝑡𝑡 − 𝑌𝑌� 𝑋𝑋 = ∑𝑡𝑡=1 𝑋𝑋𝑡𝑡 ; 𝑌𝑌 = ∑𝑡𝑡=1 𝑌𝑌𝑡𝑡 ; 𝑥𝑥𝑡𝑡 = 𝑋𝑋𝑡𝑡 − 𝑋𝑋; 𝑛𝑛 𝑛𝑛 MƠ HÌNH HỒI QUY TUYẾN TÍNH (tt) Các giả thiết mơ hình: Mơ hình có dạng tuyến tính xác định E(ut ) = ut ∼ N(μ, σ2 ) Xt ut không tương quan: cov Xt , ut = Khơng có đa cộng tuyến hồn hảo biến độc lập Phương sai không đổi: 𝑣𝑣𝑣𝑣𝑣𝑣 𝑢𝑢𝑡𝑡 = 𝜎𝜎 Khơng có tương quan chuỗi: cov 𝑢𝑢𝑠𝑠 , 𝑢𝑢𝑡𝑡 = 0, ∀𝑡𝑡 ≠ 𝑠𝑠 MƠ HÌNH HỒI QUY TUYẾN TÍNH (tt) Đặc điểm ước lượng OLS thỏa mãn giả thiết: Các ước lượng OLS đạt tiêu chuẩn BLUE (Best linear unbiased estimator) Mức độ xác ước lượng OLS đánh giá qua phương sai hệ số hồi quy 𝑣𝑣𝑣𝑣𝑣𝑣(𝛽𝛽̂𝑗𝑗 ) Với MH biến: 𝐸𝐸 𝑌𝑌𝑡𝑡 𝑋𝑋2𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑡𝑡 𝑣𝑣𝑣𝑣𝑣𝑣 𝛽𝛽̂1 = ∑𝑋𝑋𝑡𝑡2 𝜎𝜎 , 𝑣𝑣𝑣𝑣𝑣𝑣 𝑛𝑛∑𝑋𝑋𝑡𝑡 Ước lượng 𝜎𝜎 𝜎𝜎� = ∑ 𝑌𝑌𝑡𝑡 −𝑌𝑌�𝑡𝑡 𝑛𝑛−2 𝛽𝛽̂2 = 𝜎𝜎 ∑𝑋𝑋𝑡𝑡2 MƠ HÌNH HỒI QUY TUYẾN TÍNH (tt) Với MH biến: 𝐸𝐸 𝑌𝑌𝑡𝑡 𝑋𝑋2𝑡𝑡 , 𝑋𝑋3𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑡𝑡 + 𝛽𝛽3 𝑋𝑋3𝑡𝑡 +𝑋𝑋 −2𝑋𝑋 𝑋𝑋�22∑𝑥𝑥3𝑡𝑡 �32 ∑𝑥𝑥2𝑡𝑡 �2 𝑋𝑋�3 ∑𝑥𝑥2𝑡𝑡 𝑥𝑥3𝑡𝑡 ̂ 𝑣𝑣𝑣𝑣𝑣𝑣 𝛽𝛽1 = + 𝜎𝜎 , 2 ∑𝑥𝑥2𝑡𝑡 ∑𝑥𝑥3𝑡𝑡 − ∑𝑥𝑥2𝑡𝑡 𝑥𝑥3𝑡𝑡 𝑛𝑛 𝜎𝜎 𝑣𝑣𝑣𝑣𝑣𝑣 𝛽𝛽̂2 = 2 , 𝑣𝑣𝑣𝑣𝑣𝑣 𝛽𝛽̂3 = ∑𝑥𝑥2𝑡𝑡 (1−𝑟𝑟23 ) 𝜎𝜎 2 (1−𝑟𝑟 ) ∑𝑥𝑥3𝑡𝑡 23 với ước lượng không chệch 𝜎𝜎 �𝑡𝑡 ∑ 𝑌𝑌 − 𝑌𝑌 𝑡𝑡 𝜎𝜎� = 𝑛𝑛 − MÔ HÌNH HỒI QUY TUYẾN TÍNH (tt) Nhận xét: - Trường hợp hồi quy nhiều biến, phương sai hệ số hồi quy phụ thuộc vào phương sai hạng nhiễu, mẫu mối tương quan biến giải thích (hệ số tương quan biến 𝑋𝑋𝑖𝑖 𝑋𝑋𝑗𝑗 𝑟𝑟𝑖𝑖𝑖𝑖 −1 ≤ 𝑟𝑟𝑖𝑖𝑖𝑖 ≤ 1) - Trong phân tích hồi quy thường sử dụng sai số chuẩn hệ số, ký hiệu 𝑠𝑠𝑠𝑠 𝛽𝛽̂𝑗𝑗 𝑠𝑠𝑠𝑠 𝛽𝛽̂𝑗𝑗 = 𝑣𝑣𝑣𝑣𝑣𝑣(𝛽𝛽̂𝑗𝑗 ) 10 HỆ SỐ HỒI QUY CHUẨN HÓA - Để xác định biến giải thích có ảnh hưởng nhiều đến biến phụ thuộc, ta cần phải dự vào hệ số hồi quy chuẩn hóa - Hệ số hồi quy chuẩn hóa cho biết tầm quan trọng tương đối biến giải thích mơ hình hồi quy - Để ước lượng hệ số hồi quy chuẩn hóa, ta cần chuyển hóa biến (cả biến phụ thuộc) sang dạng biến chuẩn hóa, sau dùng phương pháp OLS để ước lượng - Ta chuyển hóa mơ hình hồi quy tuyến tính 𝑘𝑘 biến 𝑌𝑌𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑡𝑡 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑘𝑘𝑡𝑡 + 𝑢𝑢𝑡𝑡 16 HỆ SỐ HỒI QUY CHUẨN HÓA (tt) Mơ hình chuyển hóa sau: �2 �𝑘𝑘 𝑌𝑌𝑡𝑡 − 𝑌𝑌� 𝑋𝑋 − 𝑋𝑋 𝑋𝑋 − 𝑋𝑋 2𝑡𝑡 𝑘𝑘𝑡𝑡 = 𝛽𝛽2∗ + ⋯ + 𝛽𝛽𝑘𝑘∗ + 𝑢𝑢𝑡𝑡 𝑠𝑠𝑋𝑋2 𝑠𝑠𝑋𝑋𝑘𝑘 𝑠𝑠𝑌𝑌 Quan hệ hệ số hồi quy chuẩn hóa với hệ số hồi quy riêng 𝑠𝑠𝑋𝑋𝑗𝑗 𝛽𝛽𝑗𝑗∗ = 𝛽𝛽𝑗𝑗 (∗) 𝑠𝑠𝑌𝑌 Giả sử hệ số hồi quy chuẩn hóa 𝛽𝛽̂𝑗𝑗∗ = 0.7 cho biết thay đổi độ lệch chuẩn biến 𝑋𝑋𝑗𝑗 dẫn đến thay đổi 0.7 độ lệch chuẩn biến phụ thuộc 17 HỆ SỐ HỒI QUY CHUẨN HÓA (tt) Trong Eviews, ta thực bước sau: • Bước 1: Ước lượng mơ hình hồi quy theo OLS (giả sử mơ hình tốt nhất) • Bước 2: Tính độ lệch chuẩn tất biến scalar sy=scalar(Y) scalar sx=scalar(X) • Bước 3: Tính hệ số hồi quy chuẩn hóa theo cơng thức (*) 18 ỨNG DỤNG DỰ BÁO Dự báo trung bình: Xét hàm hồi quy hai biến: 𝐸𝐸 𝑌𝑌𝑡𝑡 𝑋𝑋𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋𝑡𝑡 - Dự báo điểm 𝐸𝐸 𝑌𝑌𝑡𝑡 𝑋𝑋𝑡𝑡 điểm 𝑋𝑋 𝑌𝑌�0 = 𝛽𝛽̂1 + 𝛽𝛽̂2 𝑋𝑋 - Khoảng tin cậy cho giá trị dự báo trung bình 𝑋𝑋 𝑛𝑛−2 𝑛𝑛−2 � � � 𝑌𝑌0 − 𝑡𝑡α 𝑠𝑠𝑠𝑠 𝑌𝑌0 ≤ 𝐸𝐸(𝑌𝑌|𝑋𝑋0 ) ≤ 𝑌𝑌0 + 𝑡𝑡 𝑠𝑠𝑠𝑠(𝑌𝑌�0 ) Trong đó: 𝑠𝑠𝑠𝑠 𝑌𝑌�0 = 𝑣𝑣𝑣𝑣𝑣𝑣 𝑌𝑌�0 = 𝜎𝜎� 𝑛𝑛 + α/2 𝑋𝑋0 −𝑋𝑋� ∑ 𝑋𝑋−𝑋𝑋� 19 ỨNG DỤNG DỰ BÁO (tt) Dự báo riêng biệt: - Khoảng tin cậy cho giá trị dự báo riêng biệt 𝑋𝑋0 𝑛𝑛−2 𝑛𝑛−2 � � � 𝑌𝑌0 − 𝑡𝑡 𝑠𝑠𝑠𝑠 𝑌𝑌0 − 𝑌𝑌0 ≤ 𝑌𝑌0 ≤ 𝑌𝑌0 + 𝑡𝑡α 𝑠𝑠𝑠𝑠(𝑌𝑌0 − 𝑌𝑌�0 ) α/2 Trong đó: 𝑠𝑠𝑠𝑠 𝑌𝑌0 − 𝑌𝑌�0 = 𝑣𝑣𝑣𝑣𝑣𝑣 𝑌𝑌0 − 𝑌𝑌�0 = 𝑛𝑛 𝜎𝜎� + + 𝑣𝑣𝑣𝑣𝑣𝑣 𝑌𝑌0 − 𝑌𝑌�0 = 𝜎𝜎� + 𝑣𝑣𝑣𝑣𝑣𝑣 𝑌𝑌�0 𝑋𝑋0 −𝑋𝑋� ∑ 𝑋𝑋−𝑋𝑋� * Các KTC cho dự báo trung bình riêng biệt tính tốn dễ dàng từ Eviews trường hợp nhiều biến 20 ỨNG DỤNG DỰ BÁO (tt) Ví dụ Khảo sát số lượng sản phẩm A bán tuần Y (sản phẩm/tuần) theo giá bán 𝑋𝑋1 (trăm nghìn đồng) chi phí quảng cáo 𝑋𝑋2 (triệu đồng/tuần) Ta sử dụng mơ hình tuyến tính sau để dự báo số lượng sản phẩm bán tuần bán với giá 𝑋𝑋1 = 8.5 trăm nghìn đồng quảng cáo với chi phí 𝑋𝑋2 = triệu đồng/tuần: 𝑌𝑌 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋1 + 𝛽𝛽2 𝑋𝑋2 + 𝑢𝑢 21 ỨNG DỤNG DỰ BÁO (tt) Dependent Variable: Y Method: Least Squares Date: 11/24/21 Time: 22:20 Sample: 15 Included observations: 15 Variable Coefficient Std Error t-Statistic C X1 X2 306.5262 -24.97509 74.13096 114.2539 10.83213 25.96732 2.682851 -2.305650 2.854779 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) 0.521478 0.441724 47.46341 27033.31 -77.50989 6.538607 0.012006 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter Durbin-Watson stat Prob 0.0199 0.0398 0.0145 Bảng bên kết ước lượng mơ hình 399.3333 63.52352 10.73465 10.87626 10.73314 1.683120 22 ỨNG DỤNG DỰ BÁO (tt) Ta thực số kiểm định cần thiết mơ hình Ramsey RESET Test Equation: UNTITLED Specification: Y C X1 X2 Omitted Variables: Powers of fitted values from to F-statistic Likelihood ratio Value 0.198642 0.584393 df (2, 10) Probability 0.8230 0.7466 Heteroskedasticity Test: Breusch-Pagan-Godfrey F-statistic Obs*R-squared Scaled explained SS 0.566245 1.293536 0.707522 Prob F(2,12) Prob Chi-Square(2) Prob Chi-Square(2) 0.5821 0.5237 0.7020 23 ỨNG DỤNG DỰ BÁO (tt) Variance Inflation Factors Date: 11/25/21 Time: 08:47 Sample: 16 Included observations: 15 Variable Coefficient Variance Uncentered VIF Centered VIF C X1 X2 13053.95 117.3349 674.3016 86.91913 35.17065 55.37427 NA 1.000927 1.000927 24 ỨNG DỤNG DỰ BÁO (tt) Date: 11/25/21 Time: 08:51 Sample: 16 Included observations: 15 Autocorrelation Partial Correlation AC 10 11 12 0.064 -0.189 -0.281 -0.232 0.159 0.199 0.103 -0.137 -0.183 -0.061 0.073 0.044 PAC Q-Stat Prob 0.064 -0.194 -0.265 -0.270 0.066 0.041 0.028 -0.111 -0.063 -0.040 -0.017 -0.124 0.0755 0.7740 2.4548 3.7079 4.3487 5.4756 5.8162 6.5007 7.9220 8.1121 8.4498 8.6149 0.783 0.679 0.484 0.447 0.500 0.484 0.561 0.591 0.542 0.618 0.673 0.735 25 ỨNG DỤNG DỰ BÁO (tt) Series: Residuals Sample 15 Observations 15 -75 -50 -25 25 50 75 Mean Median Maximum Minimum Std Dev Skewness Kurtosis 1.23e-14 -9.088457 96.15482 -63.79536 43.94258 0.594834 2.709273 Jarque-Bera Probability 0.937396 0.625817 100 26 ỨNG DỤNG DỰ BÁO (tt) - Khoảng tin cậy 95% hệ số 𝛽𝛽1 : (−48.58 < 𝛽𝛽1 < −1.37) - Khoảng tin cậy 95% hệ số 𝛽𝛽2 : (17.55 < 𝛽𝛽2 < 130.71) Như vậy, điều kiện yếu tố khác không đổi: - Nếu giá bán tăng trăm nghìn đồng số lượng sản phẩm A bán giảm khoảng (1.37; 48.58) sản phẩm - Nếu chi phí quảng cáo tăng thêm triệu đồng/tuần bán thêm khoảng 18 đến 131 sản phẩm 27 ỨNG DỤNG DỰ BÁO (tt) Hàm hồi quy mẫu: 𝑌𝑌� = 306.52 − 24.97𝑋𝑋1 + 74.13𝑋𝑋2 Nếu bán với giá 8.5 trăm nghìn chi phí quảng cáo hết triệu đồng/tuần thì: - Dự báo điểm cho số sản phẩm bán khoảng 391 sản phẩm - Dự báo khoảng trung bình cho số sản phẩm bán là: (333 < 𝐸𝐸 𝑌𝑌 𝑋𝑋1 = 8.5, 𝑋𝑋2 = < 449) - Dự báo khoảng riêng biệt cho số sản phẩm bán là: (274 < 𝑌𝑌0 < 508) 28 ỨNG DỤNG DỰ BÁO (tt) 520 Đồ thị đánh giá kết dự báo 480 440 400 360 320 280 Y 10 11 12 13 14 15 16 YF 29 KẾT THÚC CHƯƠNG

Ngày đăng: 10/01/2024, 00:23

w