Chương 1: Xử lý dữ liệu trong chăn nuôi thú y Ứng dụng Minitab trong xử lý số liệu Minitab 14 for Windows XP được sử dụng để minh họa cho các bài tập trong phần giáo trình này.
Chương I XỬ LÝ DỮ LIỆU TRONG CHĂN NUÔI THÚ Y ỨNG DỤNG MINITAB TRONG XỬ LÝ SỐ LIỆU Minitab 14 for Windows XP ñược sử dụng ñể minh hoạ cho tập phần giáo trình Nếu bạn ñọc sử dụng phiên khác Minitab khơng hỗ trợ số công cụ giao diện khác so với giáo trình 1.1 Khởi động Minitab Nếu cài đặt Minitab 14 for Windows XP theo mặc định ta khởi ñộng phần mềm cách 1) Chọn biểu tượng Minitab Desktop hình 2) Theo đường dẫn Stat > Progam > MINITAB 14 > MINITAB 14 3) C:\Progam Files\MINITAB 14\Mtb14.exe Giao diện phần mềm Minitab 14 for Windows XP gồm số thành phần chính: 1) Menu Bar, 2) Standard toolbar, 3) Project Manager Toolbar, 4) Worksheet Toolbar, 5) Title, 6) Session Window, 7) Data Window 8) Project Manager Window 8) Status bar Menu Bar Standard Toolbar Project Manager Toolbar Title Worksheet Toolbar Project Manager Windows Session Window Data Window (Worksheet Windows) Status Bar 1.2 Nhật đồ thống kê a Tóm tắt liệu biến định lượng Ví dụ 1.1: Khối lượng (gam) 16 chuột thời ñiểm cai sữa sau: 54,1 49,8 24,0 46,0 44,1 34,0 52,6 54,4 56,1 52,0 51,9 54,0 58,0 39,0 32,7 58,5 ðể tính tham số thống kê mơ tả Số liệu ñược nhập vào vào cột Windows Worksheet Thay dấu phẩy (,) dấu chấm (.) phần thập phân Ơ số liệu khuyết thay dấu (*), khơng để trống Cột số liệu phải dạng số ðối với tiêu nghiên cứu, số liệu ñược nhập dạng cột Tên cột số liệu nằm hàng thứ ðặt tên cột ngắn gọn, không nên dùng ký tự ñặc biệt (:, /…) ký tự tiếng Việt (ơ, ă…) Trong worksheet khơng đặt tên cột trùng Phần mềm Minitab khơng phân biệt ký tự viết hoa viết thường (ví dụ: MINITAB = Minitab = minitab) Chọn Stat Basic Statistics Display Descriptive Statistics Phần ô bên trái hộp thoại hiển thị cột (C1) tên cột số liệu (P) Chọn P nhấn Select để hiển thị cột cần tính tham số thống kê mô tả vào ô Variables Chọn OK ñể hiển thị kết Kết thu ñược từ Minitab sau Descriptive Statistics: P Variable P N 16 N* Mean 47.58 SE Mean 2.54 StDev 10.16 Minimum 24.00 Q1 40.28 Median 51.95 Q3 54.33 Maximum 58.50 Minitab cho kết theo mặc định Có thể sử dụng tùy chọn (option) sau ñây ñể cho kết phù hợp Chọn Statistics…có thể lựa chọn tham số sau ñây Một số thuật ngữ options Minitab thống kê mô tả Minitab Mean Tiếng Việt Trung bình Minitab Trimmed mean Tiếng Việt Trung bình hiệu chỉnh SE of mean Sai số tiêu chuẩn Sum Tổng số Standard deviation ðộ lệch chuẩn Minimum Giá trị bé Variance Phương sai Maximum Giá trị lớn Coefficient of variation Hệ số biến ñộng Range Khoảng biến ñộng First quartile Tứ vị thứ Sum of squares Tổng bình phương Median Trung vị Skewness ðộ lệch ðộ nhọn Third quartile Tứ vị thứ Kurtosis Interquartile Tứ vị thứ MSSD N nonmissing N không khuyết Cumulative N N cộng gộp N missing N khuyết Percent Phần trăm N total N tổng số Cumulative percent Phần trăm cộng gộp Chọn Graphs…ñể hiển loại thị ñồ thị sau ñây: Histogam of data tổ chức ñồ Histogam of data, with normal curve tổ chức ñồ với ñường cong chuẩn Individual value plot vẽ giá trị Boxplot of data ñồ thị hộp Chọn OK ñể có đồ thị Ví dụ chọn Boxplot of data ñể có ñược ñồ thị hộp ñây Khai báo vào By variables (Optional) để tính tham số thống kê theo phân loại nhóm Xét Ví dụ 1.1, giả sử chuột ñầu tiên sinh lứa thứ chuột sinh lứa thứ Ta bố trí cấu trúc số liệu thành cột, cột C1 (P) cột C2 (LUA) Kết từ Minitab Descriptive Statistics: P Variable P LUA N 8 N* 0 Mean 44.88 50.28 SE Mean 3.82 3.32 StDev 10.79 9.39 Minimum 24.00 32.70 Q1 36.53 42.23 Median 47.90 53.00 Q3 53.73 57.53 b Tóm tắt liệu biến định tính ðối với biến định tính số liệu thơ thu thập từ thí nghiệm ñược trình bày theo cách sau ñây: Ví dụ 1.2: Số bị sữa ba trại A, B, C 106, 132 122 Chọn ngẫu nhiên kiểm tra bệnh viêm nội mạc tử cung trại, kết sau: Cách 1: Trại A A A A A A A A A A A A A A A A A Bò số 10 12 13 14 15 16 17 Kết + - - - + + + - - - + - - - - - + Trại B B B B B B B B B B B B B B B B B B B B B B Bò số 10 12 13 14 15 16 17 18 19 20 21 22 Kết - - + - - - - - + + - - - - - + - + - + - - Trại C C C C C C C C C C C C C C C C C C C C Bò số 10 12 13 14 15 16 17 18 19 20 Kết + + - - - - + - - - + - + - - - - + + + Cách 2: Trại A Viêm nội mạc tử cung Có Khơng 11 Tổng số 17 B 16 22 C 12 20 Số liệu ñược nhập vào cột Windows Worksheet (với cách 1) Nhập liệu vào cột, Trại vào cột C1 (TRAI) cột Kết xét nghiệm vào cột C2 (KETQUA) Lưu ý: Sau nhập thông tin vào cột C1 C2 ký hiệu thay ñổi tương ứng C1-T C2-T Minitab thông báo thông tin cột dạng số mà dạng ký tự (Text) Với số liệu dạng thô (cách 1) tạo thành bảng tóm tắt cách lệnh sau Stat Tables Cross Tabulation and Chi-Square Khai báo vào ô For rows For columns Options Display hiển thị: Count tần số ñối với trường hợp Row percents tỷ lệ (phần trăm) theo hàng Column percents tỷ lệ (phần trăm) theo cột Total percents tỷ lệ (phần trăm) theo hàng/cột tổng số Chọn OK để có kết Tabulated statistics: TRAI; KETQUA Rows: TRAI Columns: KETQUA + All A 11 17 B 16 22 C 12 20 All 39 20 59 Cell Contents: Count ðối với biến định tính mơ tả biểu đồ (Bar Chart), biểu ñồ bánh (Pie Chart) Graph Chọn OK Bar Chart…Counts of unique values Chọn Multiple Graphs… Chọn OK để có biểu đồ 10 Thực tương tự để có biểu ñồ bánh Số liệu ñược nhập vào cột Windows Worksheet (với cách 2) Nhập liệu vào cột, Trại vào cột C1 (TRAI), cột Kết xét nghiệm vào cột C2 (KETQUA) Tần suất vào cột C3 (TANSUAT) dạng ký tự (Text) Với số liệu dạng thơ (cách 1) tạo thành bảng tóm tắt cách lệnh sau Stat Tables Cross Tabulation and Chi-Square Khai báo vào ô For rows, For columns Frequencies are in Chọn Counts Row percents Display để có kết Tabulated statistics: TRAI; KETQUA Using frequencies in TANSUAT Rows: TRAI Columns: KETQUA + All A 11 17 64.71 35.29 100.00 B 16 22 72.73 27.27 100.00 C 12 20 60.00 40.00 100.00 All 39 20 59 66.10 33.90 100.00 Cell Contents: Count % of Row Biểu ñồ cách nhập số liệu thứ hoàn toàn giống cách nhập số liệu, nhiên cách khai báo hộp thoại có số điểm khác Graph table Bar Chart…Values from Khai báo vào ô Graph variables Categorical variables 11 1.3 Ước lượng kiểm ñịnh giá trị trung bình a Kiểm định phân phối chuẩn ðối với tất phép thử ñây biến ñịnh lượng ñều ñược giả thiết số liệu thu thập ñược (số liệu thô) tuân theo phân phối chuẩn Nếu số liệu khơng tn theo phân phối chuẩn phép thử khơng có hiệu lực Trong trường hợp cần biến ñổi số liệu phân phối chuẩn sử dụng kiểm ñịnh phi tham số Giả thiết phép thử: H0: Số liệu có phân bố chuẩn H1: Số liệu khơng có phân bố chuẩn Ví dụ 1.3: Tăng trọng trung bình (gam/ngày) 36 lợn ni vỗ béo giống Landrace rút ngẫu nhiên từ trại chăn ni Số liệu thu sau: 577 596 594 612 600 584 618 627 588 601 606 559 615 607 608 591 565 586 621 623 598 602 581 631 570 595 603 605 616 574 578 600 596 619 636 589 Cán kỹ thuật trại cho tăng trọng trung bình tồn đàn lợn trại 607gam/ngày Theo anh chị kết luận hay sai, sao? Biết độ lệch chuẩn tính trạng 21,75 gam Nhập số liệu vào Worksheet Chọn OK để có kết 12 Stat Basic Statistics Normality Test Giá trị P-Value = 0,997 ñồ thị lớn 0,05 (α), H0 ñược chấp nhận Kết luận số liệu tuân theo phân phối chuẩn b Phép thử Z Sử dụng phép thử Z ñể kiểm ñịnh giá trị trung bình biết độ lệch chuẩn quần thể (σ σ) Minitab tính khoảng tin cậy (CI 95%) thực phép kiểm ñịnh ðối với kiểm ñịnh phía ta có giả thiết: H0: µ = µ với đối thiết µ ≠ µ 0; µ giá trị trung bình quần thể µ giá trị kiểm ñịnh Stat Basic Statistics 1-sample Z Trong Samples in columns khai báo cột số liệu (P) Trong Standard deviation ñiền giá trị 21,75 (ñộ lệch chuẩn quần thể σ) Trong Test mean ñiền giá trị 607 (giá trị quần thể kiểm định µ0) Chọn OK để có kết One-Sample Z: P Test of mu = 607 vs not = 607 The assumed standard deviation = 21.75 Variable N Mean StDev SE Mean P 36 599.194 18.656 3.625 95% CI (592.090; 606.299) Z -2.15 P 0.031 Với xác suất phép thử P = 0,031 < 0,05 (α), bác bỏ H0 chấp nhận ñối thiết H1 Kết luận: Tăng trọng lợn Landrace trại nêu không 607 gam/ ngày (P < 0,05) Khoảng tin cậy 95% 592,090 – 606,299 gam/ ngày Lưu ý: Trong số trường hợp, số liệu tóm tắt (số liệu tinh) dạng tham số thống kê mô tả Như _ ví dụ 1.3 ta có n = 36; x = 599,194 gam Vì giá trị sử dụng ñể khai báo vào lựa chọn Summarized data, giá trị khác (σ µ) khai báo tương tự để có kết sau One-Sample Z Test of mu = 607 vs not = 607 The assumed standard deviation = 21.75 N Mean SE Mean 95% CI 36 599.194 3.625 (592.089; 606.299) Z -2.15 P 0.031 13 c Phép thử T Trong trường hợp ñộ lệch chuẩn quần thể (σ), phép thử T ñược sử dụng ñể kiểm ñịnh giá trị trung bình ñộ lệch chuẩn mẫu (s) ñược sử dụng thay ñộ lệch chuẩn quần thể Giả thiết phép thử, cấu trúc số liệu tương tự phép thử Z Stat Basic Statistics 1-sample T Khai báo ñối với số liệu thô ñối với số liệu tinh Chọn OK để có kết One-Sample T: P Test of mu = 607 vs not = 607 Variable N Mean StDev P 36 599.194 18.656 SE Mean 3.109 95% CI (592.882; 605.507) T -2.51 P 0.017 Với P = 0,017 ta có kết luận tương tự ñối với sử phép thử Z 1.4 Kiểm ñịnh giá trị trung bình Khi tiến hành thí nghiệm ñể so sánh khác công thức thí nghiệm, có trường hợp chọn mẫu xảy ra: 1) Chọn mẫu ñộc lập 2) chọn mẫu theo cặp (xem 2.4, tr.23, Giáo trình Thiết kế thí nghiệm 2007) Tuỳ thuộc vào cách chọn mẫu bố trí thí nghiệm mà ta sử dụng phép thử T hay T cặp cho phù hợp a Kiểm ñịnh ñồng phương sai lấy mẫu ñộc lập ðối với kiểm ñịnh giá trị trung bình, ngồi giả thiết số liệu tn theo phân phối chuẩn, cịn vấn đề thứ Hai phương sai có đồng hay khơng? ðối với kiểm định hai phía ta có giả thiết H0: Hai phương sai ñồng (σ²1 = σ²2) H1: Hai phương sai khơng đồng (σ²1 ≠ σ²2) Khi chấp nhận giả thiết H0, phương sai chung (σ2)sẽ ñược sử dụng ñể tiến hành kiểm ñịnh phép thử T; ngược lại (bác bỏ H0) phép thử T gần thực Ví dụ 1.4: ðể so sánh khối lượng giống bò, tiến hành chọn ngẫu nhiên cân 12 ñối với giống thứ 15 ñối với giống thứ Khối lượng (kg) thu sau: Giống bị thứ Giống bò thứ hai 14 187,6 180,3 198,6 190,7 194,7 221,1 186,7 203,1 196,3 203,8 190,2 201,0 148,1 146,2 152,8 162,4 140,2 159,4 135,3 151,2 146,3 163,5 146,6 181,8 165,1 165,0 141,6 b Phân tích kết Bảng kết thu ñược có hai cột cho hai mẫu quan sát, lần lựơt có hàng sau: - Mean: Trung bình mẫu a1, a2 - Variance: Phương sai mẫu s12, s22 - Observations: Số quan sát n1 n2 - Pooled Variance: Phương sai chung tính theo cơng thức s2=((n1-1)s12+( n2-1)s22)/(n1+n2-2) - Hypothesized means difference: Giả thiết hiệu hai trung bình hai tổng thể Nếu lấy giả thuyết H0: m1=m2 ghi Nếu lấy giả thuyết H0: m1=m2+d ghi d (d số đó) - df: Bậc tự (n1+ n2-2) - t Stat: Giá trị t thực nghiệm tính theo cơng thức: t = (a1-a2)/Sqrt(s2×(1/n1+1/n2)) - P(T m2, có nghĩa khối lượng trung bình giống bị lớn khối lượng trung bình giống bị 2.2.5 So sánh trung bình lấy mẫu độc lập với giả thuyết hai phương sai khác Trong trường hợp mẫu bé phương sai khác thực theo bước sau: a Các bước thực Chọn Tools >Data Analysis > t-Test: Two-Sample Assuming Unequal Variances, sau trả lời: - Variable Range: miền liệu biến 1, kể dịng đầu chứa nhãn - Variable Range: Miền liệu biến thứ hai, kể dịng đầu chứa nhãn - Labels: Chọn mục miền liệu chọn dòng nhãn - Hypothesized means difference: Giả thiết hiệu hai trung bình hai tổng thể Nếu lấy giả thuyết H0: m1=m2 ghi Nếu lấy giả thuyết H0: m1=m2+d ghi d (d số đó) - Output Range: Chọn miền trống ñể ñặt kết Ví dụ 1.7: Thực thí nghiệm đo chiều dài giống cá x y Với giống cá x lấy mẫu ño 10 cá, Với giống cá y lấy mẫu ño 12 cá, ta có bảng số liệu sau Hãy so sánh chiều dài giống cá x y 38 x 15 17 20 23 25 17 18 22 24 22 y 14 12 13 28 12 17 25 24 30 21 23 30 * Bước 1: Kiểm ñịnh hai phương sai, thực theo mục 1.2.1, ta có kết sau: F-Test Two-Sample for Variances x Mean Variance y 20.3 20.75 11.5667 48.2045 Observations 10 12 df 11 F 0.23995 P(FData Analysis > t-Test: Two-Sample Assuming Unequal Variances, khai báo hộp thoại sau: Kết thu ñược sau: t-Test: Two-Sample Assuming Unequal Variances x Mean Variance Observations Hypothesized Mean Difference df t Stat y 20.3 20.75 11.5667 48.2045 10 12 17 -0.19784 P(T Data Analysis > Anova: Single Factor khai báo: - Input range: Khai báo miền liệu vào (một chữ nhật bao trùm toàn chứa tên mức tồn số liệu) - Grouped by: Column (số liệu theo cột) row (số liệu theo hàng) - Label in First column: nhãn dịng đầu - Alpha: 0.05 mức ý nghĩa α - Output range: miền - Chọn nút OK b Phân tích kết - Kết in gồm thống kê cho mức (trung bình, độ lệch chuẩn ) bảng phân tích phương sai - Nếu giá trị xác suất P-value >= alpha (hoặc F thực nghiệm F lý thuyết) bác bỏ Ho chấp nhận H1 cơng thức có tác ñộng khác tới kết - Khi kết luận cơng thức có tác động khác tới kết phải tiến hành bước so sánh cơng thức để rút cơng thức tốt 1.3.2 So sánh trung bình dùng ngưỡng so sánh LSD (Least sinificance diffrence) Phần mềm Excel không cho phép so sánh trung bình nhóm ứng với mức nhân tố (các công thức) Tuy nhiên, cần so sánh trung bình mi (với ri lần lặp) với trung bình mj (rj lần lặp) người dùng tự tính thêm LSD (Least Significance Difference) theo cơng thức LSD = tα,f × SQRT(s2(1/ri + 1/rj)), s2 phương sai chung ước lượng trung bình sai số bình phương nội nhóm (MS within groups), α = 1-p, tα,f giá trị t bảng Student ứng với mức ý nghĩa α f bậc tự tα,f tìm cách tra bảng số hay hàm TINV Excel * Tính trị tuyệt đối hiệu trung bình mi, mj: |mi- mj| * So sánh |mi- mj| > LSD hai trung bình khác nhau, ngược lại trung bình coi không khác Thông thường người ta lập bảng hiệu trung bình, sau lập bảng ghi kết so sánh Ví dụ 1.8: Theo dõi tăng trọng cá (kg), thí nghiệm với cơng thức nuôi (A, B, C, D, E) Số liệu thu ñược bảng sau Hãy cho biết công thức tốt * Các bước thực Excel 41 Chọn Tools> Data Analysis > Anova: Single Factor khai báo theo hộp thoại sau: * Kết thu ñược sau: Anova: Single Factor SUMMARY Groups Count A Sum 3.55 Average Variance 0.8875 0.002292 B 1.7 0.425 0.000433 C 3.05 0.7625 0.008958 D 3.75 0.9375 0.002292 E 3.8 0.95 0.001667 MS F 0.76325 0.190813 60.99494 Within Groups 0.046925 15 0.003128 Total 0.810175 19 ANOVA Source of Variation Between Groups SS df P-value 4.24E-09 F crit 3.055568 * Kết luận: P- value < 0.05 (mức ý nghĩa kiểm ñịnh) nên bác bỏ Ho chấp nhận H1 cơng thức có tác động khác tới kết * So sánh trung bình: 42 2.3.3 Phân tích phương sai hai nhân tố Khi phân tích phương sai hai nhân tố A B xảy hai trường hợp: trường hợp A B khơng tương tác (biến động gây nên tác ñộng ñồng thời A B gần sát 0) trường hợp A B tương tác (nếu trái lại) Phân tích phương sai nhân tố bố trí kiểu khối hồn tồn ngẫu nhiên coi trường hợp riêng phân tích phương sai hai nhân tố không tương tác (nhân tố khối nhân tố thứ hai không tương tác với nhân tố thứ nhất) Khi phân tích phương sai hai nhân tố khơng tương tác, số liệu cần xếp theo cách sau: hàng mức nhân tố thứ nhất, cột mức nhân tố thứ hai (trong trường hợp cần phân tích phương sai nhân tố bố trí kiểu khối ngẫu nhiên hàng mức nhân tố, cột khối ngẫu nhiên) a Phân tích phương sai hai nhân tố khơng tương tác (khơng lặp) Xét trường hợp thí nghiệm liên quan tới nhân tố A B, nhân tố có số mẫu Xét trường hợp khơng có tương tác Avà B Nhân tố A … kA X11 X12 … X1kA Nhân tố B X21 X22 … X2kA … … … … … kB XkB1 XkB2 … XkBkA 43 Ta ñi kiểm ñịnh giả thuyết H0A H0B với ñối thuyết H1A H1B (Giả thiết H0A: Các mức nhân tố A có tác động Giả thiết H0B: Các mức nhân tố B có tác động nhau) s2 A s2B F = B s2R s2R Trong ñó S2A phương sai nhân tố A, S2B phương sai nhân tố B, S2R phương sai nhân tố ngẫu nhiên Nếu: FA > F 0.05A kết luận mức nhân tố theo cột (A) có ảnh hưởng khác đến số liệu nghiên cứu FB > F 0.05B kết luận mức nhân tố theo dịng (B) có ảnh hưởng khác ñến số liệu nghiên cứu * Các bước thực Excel Chọn Tools >Data Analysis >Anova: Two Factor Without Replication sau khai báo tiếp thơng tin hình sau: Các đại lượng thống kê: FA = Hình 1.4 Hộp thoại khai báo để phân tích phương sai khơng tương tác * Phân tích kết - Nếu FA > F Crit A mức nhân tố A có ảnh hưởng khác đến kết - Nếu kết luận mức nhân tố A có ảnh hưởng khác đến kết ta tiến hành so sánh trung bình mức nhân tố A theo số LSD (tương tự phần phân tích phương sai nhân tố) - Nếu FB > F Crit B mức nhân tố B có ảnh hưởng khác đến kết - Nếu kết luận mức nhân tố B có ảnh hưởng khác đến kết ta tiến hành so sánh trung bình cơng thức nhân tố B theo số LSD (tương tự phần phân tích phương sai nhân tố) Chú ý: F F thực nghiệm, F Crit F lý thuyết tìm hàm FINV( ) F Crit A = FINV(α, kA -1, (kA-1)(kB-1)) , F Crit B = FINV(α, kB -1, (kA-1)(kB-1)) Ví dụ 1.9: Mead cộng nghiên cứu số lượng tế bào Lymphô chuột (×1000 tế bào mm-3máu) , sử dụng loại thuốc, qua lứa Số liệu ñược cho bảng sau Thực Excel khai báo liệu theo hộp thoại sau: 44 Kết xử lý cho bảng sau: Anova: Two-Factor Without Replication SUMMARY Count Sum Average Variance Thuốc A 32.1 6.42 Thuốc B 28.6 5.72 0.367 0.442 Thuốc C 30.3 6.06 0.578 Thuốc D 28.3 5.66 0.373 Lứa 27.6 6.9 0.053333 Lứa 22.4 5.6 0.193333 Lứa 24.7 6.175 0.275833 Lứa 4 20.9 5.225 0.069167 Lứa 23.7 5.925 0.235833 ANOVA Source of Variation Rows SS df MS F P-value F crit 1.8455 0.615167 11.5887 0.0007392 3.490295 Columns 6.403 1.60075 30.15542 3.544E-06 3.259167 Error 0.637 12 0.053083 Total 8.8855 19 Kết luận: + Với nhân tố thuốc sử dụng loại thuốc khác có ảnh hưởng tới số lượng tế bào lymphô máu (F > F crit) + Với nhân tố lứa lứa khác ảnh hưởng tới số lượng tế bào lymphô máu (F > F crit) b Phân tích phương sai hai nhân tố có tương tác (có lặp) Trong trường hợp phân tích phương sai ta phải tính đến tác ñộng ñồng thời A B Số liệu xếp sau: - Nhân tố ñánh theo hàng với mức khác nhau, nhân tố ñánh theo cột với mức khác 45 - Mỗi mức nhân tố (thường gọi nhân tố A) ñược dành m hàng (cho m lần lặp) mức nhân tố (thường gọi nhân tố B) cột - Tên mức nhân tố A viết lần ô ñầu tiên mức ñó, tên mức nhân tố B ghi đầu cột Các từ hàng cột trở ñi ghi số liệu Số liệu bố trí theo bảng sau: B kB X111 X121 X1kB1 X112 X122 X1kB2 A X11m X12m X1kBm X211 X221 X2KB1 X212 X222 X2kB2 X21m X22m X2kBm kA XkA11 XkA21 XkAkB1 XkA12 XkA22 XkAkB2 XkA1m XkA2m XkAkBm Tổng số lượng quan sát: n = m kA kB S2A S 2B S AB , F = , F = B AB S 2R S 2R S 2R Trong S2A phương sai nhân tố A, S2B phương sai nhân tố B, SAB phương sai tương tác AB, S2R phương sai nhân tố ngẫu nhiên * Các bước thực Excel Chọn Tools >Data Analysis >Anova: Two Factor With Replication, sau khai báo thơng tin sau: Các đại lượng thống kê: FA = Trong Rows per sample số lần lặp 46 * Phân tích kết - Nếu FA > F Crit A mức nhân tố A có ảnh hưởng khác đến kết - Nếu FB > F Crit B mức nhân tố B có ảnh hưởng khác ñến kết - Nếu FAB > F Crit AB tương tác A B có ảnh hưởng đến kết Ví dụ 1.10: Một nghiên cứu tiến hành để xác ñịnh ảnh hưởng việc bổ sung loại vitamin (A B) vào thức ăn ñể tăng trọng (kg/ngày) lợn Hai mức ñối với vitamin A (0 mg) mức ñối với vitamin B (0 mg) Số liệu thu ñược kết thúc thí nghiệm trình bày sau: Vitamin A Vitamin B mg mg mg mg mg mg 0.585 0.567 0.473 0.684 0.536 0.545 0.450 0.702 0.458 0.589 0.869 0.900 0.486 0.536 0.473 0.698 0.536 0.549 0.464 0.693 Khi xử lý Excel số liệu bố trí lại sau: Chọn Tools >Data Analysis >Anova: Two Factor With Replication, sau khai báo thông tin sau: 47 Chú ý: Miền liệu vào (Input Range) A2: C12 Khơng chọn có nhãn Vitamin B, mà ñây nhập ñể xem chỗo Số lần lặp Kết thu bảng sau: Anova: Two-Factor With Replication SUMMARY mg mg Total mg Count Sum 10 2.601 2.786 5.387 Average 0.5202 0.5572 0.5387 Variance 0.0024342 0.0004432 0.00165912 mg Count Sum Average Variance 5 10 2.729 3.677 6.406 0.5458 0.7354 0.6406 0.0327317 0.0085118 0.02831604 Total Count 10 10 5.33 6.463 Average 0.533 0.6463 Variance 0.015811333 0.0128009 SS df Sum ANOVA Source of Variation MS F P-value F crit Sample 0.05191805 0.05191805 4.706889479 0.045448 4.493998 Columns 0.06418445 0.06418445 5.818961082 0.028222 4.493998 Interaction 2.638971553 0.123804 4.493998 0.02910845 0.02910845 Within 0.1764836 16 0.01103023 Total 0.32169455 19 Theo kết xử lý, ta rút kết luận: - Vitamin A có ảnh hưởng đến tăng trọng lợn (F > F crit) - Vitamin B có ảnh hưởng ñến tăng trọng lợn (F > F crit) - Tương tác Vitamin A Vitamin B khơng ảnh hưởng đến tăng trọng lợn (F < F crit) 2.4 Tương quan Hồi quy 2.4.1 Hệ số tương quan Hệ số tương quan dùng ñể ño mức ñộ quan hệ biến Hệ số tương quan nhận giá trị từ -1 đến +1 Nếu biến theo chiều tăng cịn biến giảm hệ số tương quan âm Ngược lại biến theo chiều tăng hệ số tương quan dương Hệ số tương quan |ρ| ≥ 0,7 tương quan tuyến tính |ρ| = quan hệ hồn tồn tuyến tính Hệ số tương quan kí hiệu ρ tổng thể kí hiệu r mẫu * Tính hệ số tương quan mẫu r 48 ðối với biến x y, hệ số tương quan mẫu r tính theo công thức sau: n ∑ x i − X yi − Y r = i =1 (n − 1)s x s y )( ( ) ñây x sx trung bình độ lệch chuẩn mẫu mẫu thứ nhất, y sy trung bình độ lệch chuẩn mẫu thứ * Tính hệ số tương quan Excel: Excel cho phép tính hệ số tương quan ñơn biến xếp thành bảng gồm n hàng, n cột (mỗi cột biến) a Các bước thực Chọn Tools>Data Analysis>Correlation khai báo mục: - Input range: miền liệu kể nhãn - Grouped by: Column (số liệu theo cột) - Labels in first row: ðánh dấu √ vào có nhãn dịng đầu - Output range: miền - OK b Phân tích kết - Hệ số tương quan dòng cột ghi giao dịng cột - Hệ số tương quan âm (< 0) thể mối tương quan nghịch biến - Các hệ số tương quan có giá trị tuyệt đối xấp xỉ 0.7 trở lên thể mối tương quan tuyến tính (tương quan mạnh) hai biến Ví dụ 1.11: Xác định mối tương quan khối lượng gà mái (kg) thu nhận thức ăn năm (kg) Tiến hành quan sát 10 gà mái thu ñược kết sau: Khối lượng gà mái 2.3 2.6 2.4 2.2 2.8 2.3 2.6 2.6 2.4 2.5 Khối lượng thức ăn 43 46 45 46 50 46 48 49 46 47 - Chọn Tools>Data analysis>Correlation - Khai báo mục hình sau: 49 - Kết thu ñược bảng sau: Khối lượng gà mái Khối lượng gà mái Khối lượng thức ăn 0.779445522 Khối lượng thức ăn - Kết luận: Hệ số tương quan khối lượng gà mái khối lượng thức ăn 0.779445522 , thể mối tương quan tuyến tính 2.4.2 Hồi quy tuyến tính excel Excel cho phép tìm phương trình hồi quy tuyến tính đơn y= a+ bx hồi quy tuyến tính bội y= a0 + a1x1 + a2x2 + + anxn Các biến ñộc lập chứa n cột, biến phụ thuộc y ñể cột, giá trị tương ứng biến ñộc lập biến phụ thuộc ñược xếp hàng a Các bước thực Chọn Tools>Data Analysis>Regression khai báo mục: - Input y range: miền liệu biến y - Input x range: miền liệu biến x - Label: ðánh dấu √ vào ô có nhãn dịng đầu - Confidence level: 95% (độ tin cậy 95%) - Constant in zero: ðánh dấu √ hệ số tự a0 = - Output range: miền xuất kết - Residuals: ðánh dấu √ vào để phần dư hay sai lệch y thực nghiệm y theo hồi quy - Standardized residuals: ðánh dấu √ ñể phần dư ñã chuẩn hoá - Residuals plot: ðánh dấu √ ñể ñồ thị phần dư - Line fit plots: ðánh dấu √ ñể ñồ thị ñường dự báo - Normal probability plot: ðánh dấu √ ñể ñồ thị phần dư chuẩn hố - OK b Phân tích kết - Nếu hệ số tương quan bội xấp xỉ 0.7 lớn mơ hình hồi quy tuyến tính thích hợp (ngược lại nên tìm mơ hình khác) - Hệ số tương quan R square cho nhiên % biến ñộng y yếu tố x gây nên - Hệ số Adjusted R square không sát gần với R square chứng tỏ tất biến ñưa vào thực cần thiết - Trong bảng phân tich hồi quy mức ý nghĩa kiểm ñịnh F (Significiance F) nhỏ mức ý nghĩa α phương trình hồi quy tuyến tính chấp nhận - Nhìn vào hệ số biến ta viết ñược ñường hồi quy dự báo - Nếu suất cho cột P-value hệ số xi > α hệ số biến coi không Trong trường hợp này, cần tiến hành lọc bớt biến xi ñể ñược ñường hồi quy với hệ số có ý nghĩa 50 Ví dụ 1.12: Xác định phương trình hồi quy khối lượng gà mái (kg) thu nhận thức ăn năm (kg) Tiến hành quan sát 10 gà mái thu ñược kết sau: Khối lượng gà mái 2.3 2.6 2.4 2.2 2.8 2.3 2.6 2.6 2.4 2.5 Khối lượng thức ăn 43 46 45 46 50 46 48 49 46 47 Số liệu nhập vào Excel theo cột Chọn Tools>Data Analysis>Regression khai báo mục hình sau: Kết thu theo bảng sau: SUMMARY OUTPUT Regression Statistics Multiple R 0.779445522 R Square 0.607535322 Adjusted R Square 0.558477237 Standard Error 0.121517421 Observations 10 ANOVA df Regression SS MS 0.182868 0.1828681 Residual 0.118132 0.0147665 Total 0.301 Coefficients Intercept Khối lượng thức ăn Standard Error F 12.384 Significance F 0.007856347 t Stat P-value Lower 95% Upper 95% -0.832967033 0.939372 -0.886728 0.4010953 -2.999161935 1.333227869 Upper 95.0% 1.333227869 0.070879121 0.020141 3.5190908 0.0078563 0.024433162 0.11732508 0.11732508 51 BÀI TẬP CHƯƠNG I Bài 1: Một thí nghiệm ñược tiến hành nhằm so sánh nồng ñộ Epinephrine (PEP) huyết tương chó thuốc gây mê khác Trong nghiên cứu 10 cho ñược chọn tham gia thí nghiệm Ba loại thuốc gây mê lựa chọn ngẫu nhiên ñể gây mê cho chó Kết thu sau: Chó số 10 Thuốc A 1,07 1,35 0,69 0,28 1,24 1,53 0,49 0,56 1,02 0,30 Thuốc B 0,30 0,39 0,63 0,68 0,38 0,21 0,88 0,39 0,51 0,32 Thuốc C 0,28 0,51 1,00 0,39 0,29 0,36 0,32 0,69 0,17 0,33 So sánh hàm lượng Epinephrine loại thuốc gây mê khác nhau? Bài 2: Tiến hành nghiên cứu công thức thức ăn gia cầm Có cơng thức thức ăn (Cơng thức Cơng thức 2) tiến hành thí nghiệm trống mái Khối lượng thức ăn thu nhận (gam) thí nghiệm nêu trình bày sau: Trống Mái Cơng thức Cơng thức Công thức Công thức 70,9 59,2 65,7 50,8 67,9 53,8 59,4 50,5 69,9 47,6 67,7 50,5 So sánh lượng thức ăn thu nhận qua thí nghiệm nêu trên? 52 ... hai 14 18 7,6 18 0,3 19 8,6 19 0,7 19 4,7 2 21, 1 18 6,7 203 ,1 196,3 203,8 19 0,2 2 01, 0 14 8 ,1 146,2 15 2,8 16 2,4 14 0,2 15 9,4 13 5,3 15 1,2 14 6,3 16 3,5 14 6,6 18 1,8 16 5 ,1 165,0 14 1,6 Theo anh (chị), khối lượng... lượng giống bò Giống 18 8 18 0 19 9 19 1 19 6 204 19 0 2 01 195 2 21 187 203 Giống 14 8 14 6 15 3 13 5 15 1 14 6 16 4 14 7 16 2 14 0 15 9 18 2 16 5 16 5 14 2 d Phân tích kết - Tần số số liệu rơi vào khoảng ñược ghi cận... ñược sau: So sánh khối lượng giống bò Giống 18 8 18 0 19 9 19 1 19 6 204 19 0 2 01 195 2 21 187 203 Giống 14 8 14 6 15 3 13 5 15 1 14 6 16 4 14 7 16 2 14 0 15 9 18 2 16 5 16 5 14 2 Kiểm định giả thiết H0: khối lượng trung