Phân tích hiệp phƣơng sai (ANCOVA)

Sau đây là một số ví dụ sử dụng SAS để phân tích mô hình thống kê mà biến độc lập có cả biến phân loại và biến liên tục (hiệp biến), tức là phân tích hiệp phƣơng sai (ANCOVA). Trong các nghiên cứu chăn nuôi, thời điểm thu thập dữ liệu khó có thể cố định vào một thời điểm nhất định. Ví dụ: khối lƣợng của động vật thí nghiệm lúc bắt

đầu thí nghiệm không đồng đều nhau hoặc thiết kế thí nghiệm cân khối lƣợng của lợn ở thời điểm cai sữa 28 ngày, 60 ngày và kết thúc thí nghiệm lúc 7,5 tháng tuổi. Tuy nhiên, trong thực tế số liệu không đúng thời điểm thiết kế và thƣờng chỉ đƣợc thu thập vào các thời điểm xung quanh so với dự kiến. Nhƣ vậy khối lƣợng của động vật thí nghiệm sẽ thấp hơn so với dự kiến nếu tiến hành cân sớm và ngƣợc lại. Để khắc phục những hạn chế nêu trên, khối lƣợng của động vật thí nghiệm lúc bắt đầu thí nghiệm, thời gian cân thực tế có thể sử dụng nhƣ một hiệp biến, tức là một yếu tố gây biến động.

Ví dụ 2.12: Tiến hành nuôi vỗ béo lợn ở 3 công thức thức ăn (A, B và C) trong 90 ngày. Khối lƣợng (kg) của từng động vật thí nghiệm tại thời điểm bắt đầu (P0) và kết thúc nuôi vỗ béo (P1) và tăng khối lƣợng (TT, g/ngày) đƣợc trình bày ở bảng sau:

KP A A A A A B B B B B C C C C C P0 35 40 36 35 34 39 34 41 43 39 40 32 33 39 42 P1 122 130 124 123 121 128 120 129 132 127 129 116 117 129 132 TT 967 1000 978 978 967 989 956 978 989 978 989 933 933 1000 1000

Ta có thể dùng thủ tục ANOVA để phân tích phƣơng sai đối với số liệu nhƣ mô hình thiết kế thí nghiệm một yếu tố hoàn toàn ngẫu nhiên với biến phụ thuộc là tăng khối lƣợng và một biến độc lập (yếu tố thí nghiệm) là công thức thức ăn.

Mô hình phân tích

yij =  + i + eij

Trong đó: yij: quan sát ở cá thể thứ j ở công thức thức ăn i,

 trung bình chung,

i: ảnh hƣởng của công thức thức ăn i,

eij: sai số ngẫu nhiên, độc lập, phân phối chuẩn N(0,2

Số liệu có thể nhập vào file VIDU12.XLS định dạng excel sau đó chuyển file VIDU12.TXT định dạng txt với 4 cột lần lƣợt là khẩu phần (KP), khối lƣợng lúc bắt đầu thí nghiệm (P0), khối lƣợng kết thúc thí nghiệm (P1) và tăng khối lƣợng trung bình/ ngày trong thời gian nuôi thí nghiệm (TT).

SAS CODE của VIDU12.SAS:

data WORK.VIDU12 ;

%let _EFIERR_ = 0; /* set the ERROR detection macro variable */

infile 'D:\SAS2014\VIDU12.txt' delimiter='09'x MISSOVER DSD lrecl=32767 firstobs=2 ; informat KP $1. ; informat P0 best32. ; informat P1 best32. ; informat TT best32. ; format KP $1. ; format P0 best12. ; format P1 best12. ;

format TT best12. ; input KP $ P0 P1 TT ; PROC ANOVA; CLASS KP; MODEL TT = KP; RUN; Kết quả từ SAS:

The ANOVA Procedure Class Level Information

Class Levels Values

KP 3 A B C

Number of observations 15

Dependent Variable: TT

Source DF Sum of Squares Mean Square F Value Pr > F

Model 2 163.333333 81.666667 0.15 0.8586

Error 12 6346.000000 528.833333

Corrected Total 14 6509.333333

R-Square Coeff Var Root MSE TT Mean

0.025092 2.356991 22.99638 975.6667

Source DF Anova SS Mean Square F Value Pr > F KP 2 163.3333333 81.6666667 0.15 0.8586

Trong đó:  Kết quả phân tích phƣơng sai;  Xác suất đối với yếu tố thí nghiệm (KP) P = 0,8586. Với xác suất này giả thuyết H0 đƣợc chấp nhận, tức là “khẩu phần” không ảnh hƣởng đến tăng khối lƣợng trung bình. Nếu phân tích số liệu theo mô hình nêu trên, ta có thể đã bỏ qua một thông tin quan trọng, đó là những cá thể có khối lƣợng ban đầu khác nhau có thể cho tăng khối lƣợng khác nhau. Để khắc phục hạn chế này, khối lƣợng ban đầu đƣợc đƣa vào mô hình nhƣ hiệp biến và mô hình phân tích hiệp phƣơng sai đƣợc sử dụng để phân tích.

Mô hình phân tích:

ij i ij

y     x e

Trong đó: yij: quan sát ở cá thể thứ j ở công thức thức ăn i,

trung bình chung,

i: ảnh hƣởng của công thức thức ăn i,

xij: ảnh hƣởng của khối lƣợng bắt đầu của cá thể j ở công thức i (hiệp biến), eij: sai số ngẫu nhiên, độc lập, phân phối chuẩn N(0,2

). Sử dụng lại dữ liệu của ví dụ 2.12 nhƣng với câu lệnh SAS nhƣ sau: SAS CODE:

PROC GLM;

CLASS KP;

MODEL TT = P0 KP;

RUN;

Trong đó:  Sử dụng thục tục GLM để phân tích hiệp phƣơng sai;  yếu tố thí nghiệm là khẩu phần (KP) với  mô hình phân tích hiệp phƣơng sai với hiệp biến là khối bắt đầu (P0) và yếu tố thí nghiệm là khẩu phần (KP).

Kết quả từ SAS:

The GLM Procedure

Dependent Variable: TT

Source DF Sum of Squares Mean Square F Value Pr > F

Model 3 5409.734432 1803.244811 18.04 0.0001

Error 11 1099.598901 99.963536

Corrected Total 14 6509.333333

R-Square Coeff Var Root MSE TT Mean

0.831073 1.024753 9.998177 975.6667

Source DF Type I SS Mean Square F Value Pr > F

KP 2 866.191472 433.095736 4.33 0.0410

Trong đó:  Kết quả phân tích hiệp phƣơng sai bằng thủ tục GLM;  Bảng phân tích hiệp phƣơng sai;  Hệ số xác định của mô hình R² = 0,831073;  Xác suất đối với hiệp phƣơng sai – khối lƣợng bắt đầu thí nghiệm (P0) P <0,0001, có nghĩa khối lƣợng lúc bắt đầu thí nghiệm có ảnh hƣởng đến tăng khối lƣợng;  Xác suất đối với yếu tố thí nghiệm - khẩu phần (KP) P = 0,0410 <0,05, có nghĩa khẩu phần có ảnh hƣởng đến tăng khối lƣợng.

Nhƣ vậy, áp dụng GLM để phân tích ANCOVA đã cho ta kết quả khác với phân tích ANOVA với một yếu tố hoàn toàn ngẫu nhiên. Trong bảng phân tích phƣơng sai trên ta thấy khối lƣợng ban đầu ảnh hƣởng một cách rõ rệt đến tăng khối lƣợng của động vật thí nghiệm (P <0,001) và cũng tồn tại ảnh hƣởng của các công thức thức ăn đến tăng khối lƣợng của lợn (P = 0,0410); ngƣợc lại ở kết quả phân tích ANOVA cho thấy yếu tố thí nghiệm (khẩu phần) không ảnh hƣởng đến tăng khối lƣợng của vật nuôi (P = 0,8586). Bên cạnh đó hệ số xác định của phân tích ANOVA bé hơn nhiều so với ANCOVA và lần lƣợt là 0,025092 và 0,831073.

CƢƠNG NGHIÊN CỨU KHOA HỌC

PHÂN TÍCH PHƢƠNG SAI (ANOVA)