Có thể xây dựng phƣơng trình hồi quy đơn biến y = a + bx hoặc đa biến y = a + b1x1 + b2x2 + ... +bnxn. Với ví dụ sau, ta có thể xây dựng phƣơng trình hồi tuyến tính đơn biến quy ƣớc tính khối lƣợng trứng thông qua đƣờng kính lớn/đƣờng kính bé hoặc đa biến thông qua đƣờng kính lớn và đƣờng kính bé.
Ví dụ 2.13 đƣợc sử dụng lại để xây dựng phƣơng trình hồi quy tuyến tính. Với SAS CODE sau đây ta có thể xây dựng phƣơng trình hồi quy tuyến tính với biến phụ thuộc Y là khối lƣợng trứng và biến độc lập X là đƣờng kính lớn.
Mô hình phân tích:
Y = a + bX
Trong đó: Y: Biến phụ thuộc - khối lƣợng trứng (g) a: tung độ gốc (điểm chắn)
b: hệ số góc đối với biến độc lập X: Biến độc lập - đƣờng kính lớn (mm)
SAS code của VIDU13A.SAS:
data WORK.VIDU13 ;
%let _EFIERR_ = 0; /* set the ERROR detection macro variable */
infile 'D:\SAS2014\VIDU13.txt' delimiter='09'x MISSOVER DSD lrecl=32767 firstobs=2 ; informat KL best32. ; informat DL best32. ; informat DN best32. ; format KL best12. ; format DL best12. ; format DN best12. ; input KL DL DN ; PROC REG; MODEL KL = DL; RUN;
Trong đó: Thủ tục PROC REG để phân tích hồi quy tuyến tính; Mô hình hồi quy với biến phụ thuộc là khối lƣợng (KL) và biến độc lập là đƣờng kính lớn (DL).
Kết quả từ SAS:
The REG Procedure Model: MODEL1 Dependent Variable: KL Analysis of Variance Source DF Sum of Squares Mean Square F Value Pr > F Model 1 596.59551 596.59551 82.05 <.0001 Error 20 145.42313 7.27116 Corrected Total 21 742.01864
Root MSE 2.69651 R-Square 0.8040 Dependent Mean 61.97727 Adj R-Sq 0.7942 Coeff Var 4.35080
Parameter Estimates Variable DF Parameter
Estimate Standard Error t Value Pr > |t| Intercept 1 -53.67124 12.78032 -4.20 0.0004
DL 1 2.03786 0.22498 9.06 <.0001
Trong đó: Kết quả phân tích hồi quy với Biến phụ thuộc khối lƣợng (KL);
Kết quả phân tích phƣơng sai đối với mô hình, với P <0,0001 mô hình có ý nghĩa; Hệ số xác định R² của mô hình (R-Square) = 0,8040 và Hệ số xác định hiệu chỉnh
Adj R-Sq 2 1 1 1 0,8040 22 1 1 1 0, 7942 1 22 1 1 R N N p ; Các tham số ƣớc tính và sai số tiêu chuẩn tƣơng ứng đối với từng hệ số của phƣơng trình hồi quy;
Xác suất của tƣơng ứng với từng hệ số.
Phƣơng trình hồi quy với biến phụ thuộc là khối lƣợng (Y) và biến độc lập là đƣờng kính lớn (X) từ phần mềm SAS thu đƣợc nhƣ sau:
Khối lƣợng trứng = -53,67124 + 2,03786*đƣờng kính lớn
Phần Parameter Estimates, ngoài các hệ số của phƣơng trình hồi quy ta còn có kết quả kiểm định đối với từng hệ số. Với xác suất P = 0,0004 và P <0,0001 ta có thể kết luận các hệ số trong phƣơng trình hồi quy khác 0 (P <0,05). Hệ số xác định của phƣơng trình R² = 80,40%, hiệu chỉnh R² = 79,4%.
Ta cũng có thể xây dựng hồi quy để ƣớc tính khối lƣợng trứng thông qua 2 biến độc lập là đƣờng kính lớn và đƣờng kính bé với mô hình phân tích sau:
Y = a + b1X1 + b2X2
Trong đó: Y: Biến phụ thuộc - khối lƣợng trứng (g) A: tung độ gốc
b1: hệ số góc đối với biến độc lập thứ nhất - đƣờng kính lớn b2: hệ số góc đối với biến độc lập thứ hai - đƣờng kính bé X1: Biến độc lập thứ nhất - đƣờng kính lớn (mm)
X2: Biến độc lập thứ hai - đƣờng kính bé (mm)
Bạn đọc có thể sử dụng lại dữ liệu ở ví dụ 2.13 với thay đổi code đối với mô hình, cụ thể nhƣ sau:
SAS CODE VIDU13B.SAS:
MODEL KL = DL DN;
RUN;
Trong đó: Trong mô hình này, có 2 biến độc lập đó là đƣờng kính lớn (DL) và đƣờng kính bé (DN).
Kết quả từ SAS:
The REG Procedure Model: MODEL1 Dependent Variable: KL
Analysis of Variance
Source DF Sum of Squares Mean Square F Value Pr > F
Model 2 731.05126 365.52563 633.24 <.0001
Error 19 10.96738 0.57723
Corrected Total 21 742.01864
Root MSE 0.75976 R-Square 0.9852 Dependent Mean 61.97727 Adj R-Sq 0.9837 Coeff Var 1.22586
Parameter Estimates
Variable DF Parameter Estimate Standard Error t Value Pr > |t|
Intercept 1 -116.55512 5.47204 -21.30 <.0001
DL 1 1.21473 0.08323 14.60 <.0001
DN 1 2.47638 0.16226 15.26 <.0001
Ta có kết quả hoàn toàn tƣơng tự nhƣ việc xây dựng phƣơng trình hồi quy đơn biến: Y = -116,55512 + 1,21473X1 + 2,47638X2
Trong đó: Y: khối lƣợng trứng, X1: đƣờng kính lớn, X2: đƣờng kính bé.
Điều khác biệt trong trƣờng hợp này là hệ số xác định R² = 98,5%, lớn hơn so với trƣờng hợp đơn biến R² = 80,4%; cũng tƣơng tự đối với hệ số xác định hiệu chỉnh 98,37% so với 79,42%.