III. Mô hình hồi quy
3.2 Mô hình hồi quy đa biến
Giả sử thời gian trung bình E (y) yêu cầu để thực hiện một công việc xử lý dữ liệu tăng nếu tăng việc sử dụng máy tính và các mối quan hệ đó là đường cong. Thay vì sử dụng mô hình đường thẳng E(y) = A +B để mô hình hóa mối quan hệ, chúng ta có thể sử dụng mô hình bậc hai E (y) = A + + 2,
trong đó x1 là một biến đo việc sử dụng máy tính.
Nếu, ngoài ra, ta nghĩ rằng thời gian là cần thiết để xử lý một công việc cũng liên quan đến kích thước x2 của công việc, chúng tôi có thể bao hàm trong mô hình. Ví dụ, mô hình đầu tiên trong trường hợp này là
E (y) = + +
và mô hình thứ hai: E (y) = + + + + 2 +2.
Tất cả các mô hình mà chúng ta đã xét gọi là mô hình tuyến tính, bởi vì E (y) là một hàm tuyến tính của các tham số chưa biết , , , ...
Mô hình E (y) = A
không phải là một mô hình tuyến tính vì E (y) không phải là một hàm tuyến tính của các tham số mô hình chưa biết A và B.
Lưu ý rằng bằng cách đưa ra các biến số mới để mô hình bậc hai có thể được viết dưới dạng các mô hình bậc nhất. Ví dụ, đặt x2 = x12, mô hình bậc hai
trở thành mô hình bậc nhất E (y) = + + .
Do vậy, trong tương lai chúng ta chỉ xem xét mô hình hồi quy bậc nhất đa biến. Mô hình tuyến tính đa biến tổng quát:
y = + + ... + + e, trong đó
y = biến phụ thuộc (biến được mô hình hóa – sometimes called the response variable)
, , ..., = Biến độc lập ( variable used as a predictor of y) e = Lỗi ngẫu nhiên
xác định sự đóng góp của các biến độc lập
Các giả định cần thiết cho một mô hình hồi quy tuyến tính đa biến y = + + ... + + e. Trong đó e là sai ngẫu nhiên
2. Đối với các giá trị bất kỳ của , , .. Kiểm định một phía Kiểm định hai phía
Ho: Bi = 0 Ha: Bi < 0 (or Bi > 0) Kiểm định thống kê: t = vùng loại bỏ t < - t( hoặc t> t), tdựa trên [ n- (k+1)] = df, n = số các quan sát, Ho: Bi = 0 Ha: Bi 0 Kiểm định thống kê: t = vùng loại bỏ t < - t or t > t,
trong đó tdựa trên [ n- (k+1)]=df, n = số các quan sát,
., , lỗi ngẫu nhiên e có phân bố chuẩn với trung bình bằng 0 và phương sai bằng 2 .
3. Các lỗi ngẫu nhiên là độc lập.
4. Ví dụ: Cho bảng số liệu về Sản phẩm điện tử, máy tính, quang học, Thiết bị điện và Máy móc thiết bị chưa được phân vào đâu các năm 2012-2020 như sau :
Năm Sản phẩm điện tử,
máy tính, quang học Thiết bị điện
Máy móc thiết bị chưa được phân vào đâu
2012 113.14 105.31 113.74 2013 100.05 103.03 105.46 2014 100 94.02 101.14 2015 103.53 101.15 100.43 2016 101.83 101.87 100.83 2017 90.06 103.34 101.24 2018 106.51 101.97 100.39 2019 106.83 100.9 100.2 2020 106.54 100.93 100.06
- Mô hình hồi qui đa biến Sản phẩm điện tử, máy tính, quang học
phụ thuộc vào Thiết bị điện và Máy móc thiết bị chưa được phân vào đâu: SanPham_DienTu_MayTinh_QuangHoc = 45.8534 +
0.66919*MayMocThietBiChuaDuocPhanVaoDau - 0.111976*ThietBi_DienTu Kiểm định:
+ Máy móc thiết bị chưa được phân vào đâu: Đặt:
H0: B1=0; Ha: B1!=0
=1.09915 < = (0.025,n-(k+1))= (0.025, 6)= 2.447 Bác bỏ Ha, chấp nhận Ho có nghĩa là B=0
Sản phẩm điện tử, máy tính, quang học phụ không thuộc vào Máy móc thiết bị chưa được phân vào đâu
+ Thiết bị điện: Đặt: Ho: B2=0; Ha: B2!=0 = -0.127323 = (0.025,n-(k+1))= (0.025, 6)= 2.447 Chấp nhận Ha, bác bỏ Ho có có nghĩa là B2= 0
Sản phẩm điện tử, máy tính, quang học không phụ thuộc vào Thiết bị điện: