Ở mục 2.3.1, mối liên hệ tuyến tính giữa các biến đã đƣợc đề cập đến. Trong sinh học mối liên hệ giữa các biến có thể tồn tại nhƣng ở dƣới dạng phi tuyến. Trong những trƣờng hợp nhƣ vậy mô hình tuyến tính nêu trên sẽ không còn phù hợp.
Ví dụ 2.14: Khối lƣợng của gà Hồ (gram) qua các tuần tuổi (từ 0 đến 10 tuần tuổi) đƣợc trình bày ở bảng sau:
Tuần tuổi (tuần) 0 1 2 3 4 5 6 7 8 9 10 Khối lượng (gram) 35 45 72 134 199 303 374 529 672 717 899
Nếu thể hiện mối liên hệ giữa khối lƣợng và tuần tuổi bằng các điểm () trên đồ thị ta thấy mối liên hệ giữa 2 biến này không phải là tuyến tính (xem đƣờng ---) mà có mối liên hệ phi tuyến bậc 2 (xem đƣờng —).
Ta có mô hình phân tích: y = a + b1x + b2x²
Số liệu có thể nhập vào file VIDU14.XLS định dạng excel sau đó chuyển file VIDU14.TXT định dạng txt với 2 cột lần lƣợt là khối lƣợng (KL) và tuần tuổi (TUAN).
SAS code của VIDU14.SAS:
data WORK.VIDU14 ;
%let _EFIERR_ = 0; /* set the ERROR detection macro variable */
infile 'D:\SAS2014\VIDU14.txt' delimiter='09'x MISSOVER DSD lrecl=32767 firstobs=2 ;
informat KL best32. ; informat TUAN best32. ; format KL best12. ; format TUAN best12. ;
input
TUAN ;
TUAN2 = TUAN*TUAN;
PROC REG;
MODEL KL = TUAN TUAN2;
RUN;
Trong đó: Trong file số liệu có 2 cột số liệu (KL và TUAN); TUAN2 = TUAN*TUAN; câu lệnh sử dụng để tạo ra cột mới (TUAN2) bằng bình phƣơng của cột tuần (TUAN*TUAN); nhƣ vậy trong bộ số liệu sẽ có 3 cột, bao gồm: 2 cột đã có sẵn (khối lƣợng và tuần) và cột thứ 3 (TUAN2) bằng bình phƣơng của cột tuần; Câu lệnh chạy mô hình hồi quy; Mô hình hồi quy, trong đó khối lƣợng (KL) là biến phụ thuộc, biến tuần (TUAN) và tuần bình phƣơng (TUAN2) là biến độc lập trong mô hình.
Kết quả từ SAS:
The REG Procedure
Model: MODEL1 Dependent Variable: KL
Analysis of Variance
Source DF Sum of Squares Mean Square F Value Pr > F
Model 2 905796 452898 576.73 <.0001
Error 8 6282.31329 785.28916
Corrected Total 10 912078
Root MSE 28.02301 R-Square 0.9931 Dependent Mean 361.72727 Adj R-Sq 0.9914 Coeff Var 7.74700
Parameter Estimates
Variable DF Parameter Estimate Standard Error t Value Pr > |t| Intercept 1 16.67832 21.34941 0.78 0.4572 TUAN 1 22.72657 9.93300 2.29 0.0514 TUAN2 1 6.61189 0.95669 6.91 0.0001
Trong đó: Kết quả phân tích hồi quy; Đối với biến phụ thuộc khối lƣợng (KL);
Bảng kết quả phân tích phƣơng sai; Hệ số xác định của mô hình (R-Square) = 0,9931, nghĩa là 99,31% biến động đƣợc giải thích bằng mô hình hồi quy;
Hệ số xác định hiệu chỉnh theo các biến độc lập trong mô hình (Adj R-Sq) = 0,9914. Adj R-Sq = 2 1 1 1 1 R N N p , trong đó R², N và p lần lƣợt là hệ số xác định, dung lƣợng mẫu và số biến độc lập; Các hệ số ƣớc tính bao gồm tung độ gốc (Intercept) =16,67832, hệ số góc đối với biến thứ nhất (TUAN) = 22,72657 và hệ số góc đối với biến thứ 2 (TUAN2); Xác suất đối với từng hệ số.
Dựa trên kết quả phân tích, mô hình hồi quy có thể đƣợc viết nhƣ sau:
Khối lượng = 16,67832 + 22,72657*Tuần + 6,61189*Tuần²