Hồi quy tuyến tính đơn và đa biến

Một phần của tài liệu giáo trình phân tích số liệu SAS (Trang 93 - 97)

Có thể xây dựng phƣơng trình hồi quy đơn biến y = a + bx hoặc đa biến y = a + b1x1 + b2x2 + ... +bnxn. Với ví dụ sau, ta có thể xây dựng phƣơng trình hồi tuyến tính đơn biến quy ƣớc tính khối lƣợng trứng thông qua đƣờng kính lớn/đƣờng kính bé hoặc đa biến thông qua đƣờng kính lớn và đƣờng kính bé.

Ví dụ 2.13 đƣợc sử dụng lại để xây dựng phƣơng trình hồi quy tuyến tính. Với SAS CODE sau đây ta có thể xây dựng phƣơng trình hồi quy tuyến tính với biến phụ thuộc Y là khối lƣợng trứng và biến độc lập X là đƣờng kính lớn.

Mô hình phân tích:

Y = a + bX

Trong đó: Y: Biến phụ thuộc - khối lƣợng trứng (g) a: tung độ gốc (điểm chắn)

b: hệ số góc đối với biến độc lập X: Biến độc lập - đƣờng kính lớn (mm)

SAS code của VIDU13A.SAS:

data WORK.VIDU13 ;

%let _EFIERR_ = 0; /* set the ERROR detection macro variable */

infile 'D:\SAS2014\VIDU13.txt' delimiter='09'x MISSOVER DSD lrecl=32767 firstobs=2 ; informat KL best32. ; informat DL best32. ; informat DN best32. ; format KL best12. ; format DL best12. ; format DN best12. ; input KL DL DN ; PROC REG; MODEL KL = DL; RUN;

Trong đó:  Thủ tục PROC REG để phân tích hồi quy tuyến tính;  Mô hình hồi quy với biến phụ thuộc là khối lƣợng (KL) và biến độc lập là đƣờng kính lớn (DL).

Kết quả từ SAS:

The REG Procedure Model: MODEL1 Dependent Variable: KL Analysis of Variance Source DF Sum of Squares Mean Square F Value Pr > F Model 1 596.59551 596.59551 82.05 <.0001 Error 20 145.42313 7.27116 Corrected Total 21 742.01864

Root MSE 2.69651 R-Square 0.8040 Dependent Mean 61.97727 Adj R-Sq 0.7942 Coeff Var 4.35080

Parameter Estimates Variable DF Parameter

Estimate Standard Error t Value Pr > |t| Intercept 1 -53.67124 12.78032 -4.20 0.0004

DL 1 2.03786 0.22498 9.06 <.0001

Trong đó:  Kết quả phân tích hồi quy với  Biến phụ thuộc khối lƣợng (KL); 

Kết quả phân tích phƣơng sai đối với mô hình, với P <0,0001 mô hình có ý nghĩa;  Hệ số xác định R² của mô hình (R-Square) = 0,8040 và  Hệ số xác định hiệu chỉnh

Adj R-Sq  2     1 1 1 0,8040 22 1 1 1 0, 7942 1 22 1 1 R N N p                          ;  Các tham số ƣớc tính và  sai số tiêu chuẩn tƣơng ứng đối với từng hệ số của phƣơng trình hồi quy;

 Xác suất của tƣơng ứng với từng hệ số.

Phƣơng trình hồi quy với biến phụ thuộc là khối lƣợng (Y) và biến độc lập là đƣờng kính lớn (X) từ phần mềm SAS thu đƣợc nhƣ sau:

Khối lƣợng trứng = -53,67124 + 2,03786*đƣờng kính lớn

Phần Parameter Estimates, ngoài các hệ số của phƣơng trình hồi quy ta còn có kết quả kiểm định đối với từng hệ số. Với xác suất P = 0,0004 và P <0,0001 ta có thể kết luận các hệ số trong phƣơng trình hồi quy khác 0 (P <0,05). Hệ số xác định của phƣơng trình R² = 80,40%, hiệu chỉnh R² = 79,4%.

Ta cũng có thể xây dựng hồi quy để ƣớc tính khối lƣợng trứng thông qua 2 biến độc lập là đƣờng kính lớn và đƣờng kính bé với mô hình phân tích sau:

Y = a + b1X1 + b2X2

Trong đó: Y: Biến phụ thuộc - khối lƣợng trứng (g) A: tung độ gốc

b1: hệ số góc đối với biến độc lập thứ nhất - đƣờng kính lớn b2: hệ số góc đối với biến độc lập thứ hai - đƣờng kính bé X1: Biến độc lập thứ nhất - đƣờng kính lớn (mm)

X2: Biến độc lập thứ hai - đƣờng kính bé (mm)

Bạn đọc có thể sử dụng lại dữ liệu ở ví dụ 2.13 với thay đổi code đối với mô hình, cụ thể nhƣ sau:

SAS CODE VIDU13B.SAS:

MODEL KL = DL DN;

RUN;

Trong đó:  Trong mô hình này, có 2 biến độc lập đó là đƣờng kính lớn (DL) và đƣờng kính bé (DN).

Kết quả từ SAS:

The REG Procedure Model: MODEL1 Dependent Variable: KL

Analysis of Variance

Source DF Sum of Squares Mean Square F Value Pr > F

Model 2 731.05126 365.52563 633.24 <.0001

Error 19 10.96738 0.57723

Corrected Total 21 742.01864

Root MSE 0.75976 R-Square 0.9852 Dependent Mean 61.97727 Adj R-Sq 0.9837 Coeff Var 1.22586

Parameter Estimates

Variable DF Parameter Estimate Standard Error t Value Pr > |t|

Intercept 1 -116.55512 5.47204 -21.30 <.0001

DL 1 1.21473 0.08323 14.60 <.0001

DN 1 2.47638 0.16226 15.26 <.0001

Ta có kết quả hoàn toàn tƣơng tự nhƣ việc xây dựng phƣơng trình hồi quy đơn biến: Y = -116,55512 + 1,21473X1 + 2,47638X2

Trong đó: Y: khối lƣợng trứng, X1: đƣờng kính lớn, X2: đƣờng kính bé.

Điều khác biệt trong trƣờng hợp này là  hệ số xác định R² = 98,5%, lớn hơn so với trƣờng hợp đơn biến R² = 80,4%; cũng tƣơng tự đối với  hệ số xác định hiệu chỉnh 98,37% so với 79,42%.

Một phần của tài liệu giáo trình phân tích số liệu SAS (Trang 93 - 97)

Tải bản đầy đủ (PDF)

(171 trang)