BIẾN ĐỔI SỐ LIỆU

Một phần của tài liệu Bài giảng thiết kế thí nghiệm (dùng cho giảng dạy cao học các ngành chăn nuôi, nuôi trồng thuỷ sản công nghệ thực phẩm) (Trang 96 - 104)

Khi số liệu có phân bố chuẩn và các phương sai đồng nhất, việc phân tích số liệu và đưa

ra các kết luận sẽđơn giản. Trong một sốtrường hợp các điều kiện nêu trên không được thỏa mãn bạn đọc sẽ có 2 lựa chọn: (1) biến đổi số liệu và (2) sử dụng thống kê phi tham số (xem mục 2.6). Mục này sẽđề cập đến cách biến đổi số liệu để có thể thỏa mãn điều kiện của bài toán.

Có 3 cách biến đổi dữ liệu thường được sử dụng đối với các biến (x) trong sinh học, bao gồm:

93

(1) logarit: x’= log(x) sử dụng trong trường hợp số liệu có xu hướng lệch phảị Logarit

cơ số10 và cơ sốe được sử dụng phổ biến nhất sẽ sử dụng hàm logarit.

(2) bình phương: x’= x² sử dụng trong trường hợp số liệu lệch tráị

(3) logistics: x’= log[x/(1-x)] sử dụng trong trường hợp tỷ lệ/phần trăm đặc biệt là với hàm phân bố nhị thức (xem ví dụ 2.18 phần 2.4.2).

Ngoài ra còn có cách biến đổi sử dụng arcsin hay biến đổi tổng quát BOX COX. Xem xét ví dụsau đây:

Ví dụ 2.19. Thí nghiệm được tiến hành nhằm đánh giá ảnh hưởng của chế phẩm sinh học

(A, B và C) đến lượng vi sinh vật trong phân chuồng. Thí nghiệm được tiến hành qua 2 mùa

(hè và đông). Số liệu thu được trình bày ở bảng dưới đâỵ Tiến hành phần tích số liệu và cho biết ảnh hưởng của yếu tố thí nghiệm. Lưu ý kiểm tra phân bố chuẩn của số liệụ

Chế phẩm Hè Đông A 3.800.000 13.000.000 A 1.000.000 1.600.000 A 320.000 360.000 B 1.600.000 400.000 B 100.000 1.100.000 B 100.000 1.000.000 C 22.000.000 1.600.000 C 11.000.000 1.800.000 C 14.000.000 120.000.000 Mô hình phân tích:   ijk i j ij ijk y        Trong đó: yijk: quan sát thứ k ở chế phẩm thứ i và mùa j

trung bình chung

i: ảnh hưởng của chế phẩm i,

j: ảnh hưởng mức của mùa j,

()ij: tương tác giữa mức i của chế phẩm và mức j của mùa

ijk: sai số ngẫu nhiên, độc lập, phân phối chuẩn N(0,2)

94

Số liệu được nhập trong Minitab; bao gồm 3 cột: 1) cột Chế phẩm C1 (CP);

2) cột Mùa C2 (MUA);

3) cột Số lượng vi sinh vật C3 (VSV);

95

Khai báo biến phụ thuộc (biến đáp ứng) VSV vào ô Response.

Khai báo biến độc lập: CP, MUA và CP*MUA vào ô Factor.

Kích chuột vào Option Storagẹ.. và kích chuột vào ô Residualsđể lấy cột phần dư (RESI1) dùng kiểm tra phân bố chuẩn

Chọn OKđể có kết quả

General Linear Model: VSV versus CP, MUA

Factor Type Levels Values CP fixed 3 1, 2, 3 MUA fixed 2 1, 2

Analysis of Variance for VSV, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F P CP 2 2.80191E+15 2.80191E+15 1.40095E+15 1.77 0.212 MUA 1 4.19920E+14 4.19920E+14 4.19920E+14 0.53 0.480 CP*MUA 2 5.69126E+14 5.69126E+14 2.84563E+14 0.36 0.705 Error 12 9.50029E+15 9.50029E+15 7.91691E+14

96

S = 28137006 R-Sq = 28.52% R-Sq(adj) = 0.00%

Kết quả phân tích phương sai đối với các yếu tố trong mô hình. Kết quả cho thấy không ảnh

hưởng của chế phẩm (P = 0,212), mùa (P = 0,480) và không có tương tác giữa 2 yếu tố này (P

= 0,705) đến sốlượng vi sinh vật.

Kiểm tra phân bố chuẩn đối với biến phần dư (RESI1)

Khai báo biến RESI1 vào ô Variable.

Chọn OKđể có kết quả 75000000 50000000 25000000 0 -25000000 -50000000 99 95 90 80 70 60 50 40 30 20 10 5 1 RESI1 P e rc e n t Mean -8.27842E-10 StDev 23639814 N 18 A D 2.781 P-Value <0.005

Probability Plot of RESI1

97 Giá trị P <0,005, như vậy H0 bị bác bỏ và chấp nhận H1 tức là cột phần dư không có phân bố

chuẩn. Kết luận: Số liệu không tuân theo phân phối chuẩn. Do đó, phân tích phương sai sẽ không có ý nghĩạ

Tiến hành biến đổi số liệu: Tạo cột mới logarit VSV C5 (LOGVSV)

Calc Calculator...

Khai báo biến LOGVSV vào ô Store result in variable.

Nhập công thức logarit: log(VSV) vào ô Expression.

Chọn OKđể có kết quả

98

Khai báo biến phụ thuộc (biến đáp ứng) LOGVSV vào ô Response.

Khai báo biến độc lập: CP, MUA và CP*MUA vào ô Factor.

Kích chuột vào Option Storagẹ.. và kích chuột vào ô Residualsđể lấy cột phần dư (RESI1) dùng kiểm tra phân bố chuẩn

Chọn OKđể có kết quả

General Linear Model: LOGVSV versus CP, MUA

Factor Type Levels Values CP fixed 3 1, 2, 3 MUA fixed 2 1, 2

Analysis of Variance for LOGVSV, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F P

CP 2 30.448 30.448 15.224 6.61 0.012 MUA 1 0.451 0.451 0.451 0.20 0.666 CP*MUA 2 2.799 2.799 1.399 0.61 0.561 Error 12 27.654 27.654 2.305

99

S = 1.51806 R-Sq = 54.93% R-Sq(adj) = 36.14%

Kiểm tra phân bố chuẩn đối với biến phần dư (RESI2)

Khai báo biến RESI2 vào ô Variable.

Chọn OKđể có kết quả 3 2 1 0 -1 -2 -3 99 95 90 80 70 60 50 40 30 20 10 5 1 RESI2 P e rc e n t Mean -2.96059E-16 StDev 1.275 N 18 A D 0.429 P-Value 0.277

Probability Plot of RESI2

Normal

Xác suất của phần dư P = 0,277 cho thấy sau khi biến đổi số liệu phần dư đã có phân bố

100 nhất); Xác suất của yếu tố chế phẩm P = 0,012 nên có thể kết luận rằng có sự sai khác về sốlượng vi sinh vật giữa các chế phẩm khác nhaụ

Lưu ý: trước khi biến đổi số liệu giả thiết H0 được chấp nhận (chế phẩm không ảnh

hưởng) và sau khi biến đổi số liệu giả thiết H0 bị bác bỏ (chế phẩm ảnh hưởng đến sốlượng vi sinh vật). Như vậy việc kiểm tra điều kiện của phép thửvà tìm phương pháp biến đổi số liệu phù hợp có thể cho ta kết luận chính xác hơn.

Một phần của tài liệu Bài giảng thiết kế thí nghiệm (dùng cho giảng dạy cao học các ngành chăn nuôi, nuôi trồng thuỷ sản công nghệ thực phẩm) (Trang 96 - 104)

Tải bản đầy đủ (PDF)

(149 trang)