Bài giảng Xử lý thống kê với phần mềm SPSS - Bài 3: Phân tích phương sai một nhân tố

20 143 0
Bài giảng Xử lý thống kê với phần mềm SPSS - Bài 3: Phân tích phương sai một nhân tố

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giảng cung cấp cho người học các kiến thức: Phân tích phương sai một nhân tố, kiểu bố trí hoàn toàn ngẫu nhiên, mô hình toán học,... Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu. Mời các bạn cùng tham khảo chi tiết nội dung tài liệu.

Bài PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ I- NỘI DUNG Trong chương trước trình bầy cách so sánh hai trung bình hai tổng thể, mở rộng sang so sánh trung bình nhiều tổng thể có tốn phân tích phương sai nhân tố (single factor anova) Theo dõi ảnh hưởng a cơng thức hay nghiệm thức thí nghiệm (treatement) đến kết thí nghiệm Cơng thức bao gồm yếu tố (Giống, chế độ canh tác, mật độ trồng, loại thuốc trừ sâu bệnh, phương pháp làm đất, chế độ nước ), bao gồm nhiều yếu tố (giống x phân bón, giống x mật độ, mật độ x chế độ nước x phân bón ), không xét tác động riêng yếu tố mà xét tác động chung yếu tố gọi tác động nhân tố Trong tài liệu nhân tố A đươc coi cố định (Fixed) Việc bố trí thí nghiệm ( thiết kế thí nghiệm) để so sánh trung bình a cơng thức gọi bố trí thí nghiệm nhân tố, cơng thức thí nghiệm mức nhân tố Các mức coi định tính có tên, thường gọi nhãn (label), để đơn giản gọi a mức A1, A2 , Aa Làm thí nghiệm so sánh suất giống ngơ nhân tố gồm yếu tố có mức giống ngơ, hay gọi công thức Mỗi giống ngô thử nghiệm số thí nghiêm (hay đơn vị thí nghiệm), ô coi lần lặp (repetition) Thí dụ giống lặp lại lần phải có = 15 thí nghiệm Thí nghiệm giống ngơ cơng thức bón phân xét tác động chung tổ hợp Giống x Phân (Gi x Pj) có thí nghiệm nhân tố với = 20 cơng thức thí nghiệm, công thức lặp lại lần, phải có = 60 thí nghiệm Vì quan tâm đến nhân tố nên liệu thành nhóm, nhóm lần lặp mức nhân tố gọi việc phân tích số liệu nhằm N D Hien 24 tách biệt phương sai theo hai nguồn biến động nhân tố sai số tốn phân tích phương sai cách xếp (one way anova) Giả sử công thức Ai thực ri thí nghiệm, kết xij coi mẫu quan sát biến ngẫu nhiên Xi mục đích đặt so sánh trung bình mi biến Xi Có nhiều kiểu bố trí thí nghiệm để giải tốn Giả sử nhân tố có a mức, mức i lặp lại ri lần, tổng số có n =  ri quan sát, hay nói có n thí nghiệm Nếu bố trí n thí nghiệm hồn tồn ngẫu nhiên kiểu bố trí gọi kiểu bố trí (thiết kế) hồn tồn ngẫu nhiên (Completely randomized design) a - KIỂU BỐ TRÍ HOÀN TOÀN NGẪU NHIÊN (Completely randomized design CRD) Khi tiến hành thí nghiệm kiểu phải dùng n phiếu ghi từ đến n, rút thăm ngẫu nhiên r1 phiếu để có thí nghiệm cơng thức 1, rút tiếp r2 phiếu để có thí nghiệm công thức 2, , ô cuối công thức a Như việc rút thăm ngẫu nhiên thực tồn thí nghiệm a1- Mơ hình tốn học Việc tính tốn kết luận dựa số giả thiết thể mơ hình sau: xi j =  +  i + ei j (i = 1, a; j =1, ri) (1) xi j kết lần lặp thứ j mức i,  trung bình chung, i ảnh hưởng mức i nhân tố, ei j sai số ngẫu nhiên x ij có trung bình mi = +i Các sai số eij giả thiết độc lập, phân phối chuẩn, kỳ vọng 0, phương sai 2 Các i thoả mãn điều kiện ràng buộc i = a2- Các bước tính Giả sử có a mức, mức Ai lặp lại r i lần Tổng số ô thí nghiêm (hay số số liệu) n =  ri = 24 Tổng số liệu công thức i TAi =  xi j , trung bình xi j (xem bảng) N D Hien 25 Tổng tất số liệu ST =  x i ij trung bình chung x  j ST n Số điều chỉnh G = ST2 / n Tính tổng bình phương: Tổng bình phương tồn ri a a ri SSTO   ( xij  x )   xij2  G i 1 j 1 i 1 j 1 Tổng bình phương nhân tố: a ri a TAi2 G i 1 ri SSA   ( xi  x )   i 1 j 1 Tổng bình phương sai số: SSE = SSTO- SSA = 260,2148 - 140,6471 = 119,5677 Tính bậc tự Bậc tự SSTO dfTO = n - Bậc tự SSA dfA = a -1 Bậc tự SSE dfE = n - a Đem tổng bình phương SSA SSE chia cho bậc tự tương ứng bình phương trung bình msA, msE Ftn = msA msE Giá trị tới hạn Flt = F(,dfA,dfE) Sai số thí nghiệm bình phương msE, ký hiệu se2 với bậc tự dfE = n - a Tóm tắt kết vào bảngsau: Bảng phân tích phương sai Nguồn biến động Giữa mức Tổng BP SSA Bâc tự dfA = a -1 Bình phương trung bình msA= SSA/dfA Sai số ngẫunhiên SSE dfE = n - a msE =SSE / dfE Toàn N D Hien Ftn msA/msE Flt F(,dfA, dfE) = se2 SSTO dfTO= n-1 26 a3-Kết luận Dùng bảng phân tích phương sai để kiểm định giả thiết H0:“ Khơng có khác trung bình mi”, đối thiết H1: “Có khác trung bình mi” Có thể viết lại theo i có giả thiết H0:“Các i ”với đối thiết H1: ” Không phải i 0” Quy tắc kiểm định: So Ftn với ngưỡng Flt Nếu Ftn Flt chấp nhận H1: “Có khác trung bình mi mức nhân tố ” Sai số trung bình x se  se n Sai số trung bình cơng thức seA = se seB = se rb seC = seD = se rc se rD b- KIỂU BỐ TRÍ KHỐI NGẪU NHIÊN ĐẦY ĐỦ ( Randomized complete block design RCBD hay RCB) Để tiến hành thí nghiệm giả sử có a cơng thức, cơng thức lặp lại r lần Tất có n = a x r thí nghiệm Chọn r khối, khối chia thành a thí nghiệm Lấy khối thứ làm a phiếu để bắt thăm xem a cơng thức xếp vào a nào, sau bắt thăm cho khối thứ hai, thứ ba, , thứ a Như việc chọn ngẫu nhiên làm riêng cho khối Việc chia khối khơng có đủ n thí nghiệm đồng nên phải chia thành r khối cho a ô khối tương đối đồng đều.Cũng có thời gian N D Hien 27 hạn chế ngày làm a thí nghiệm khơng thể làm tất n = a x r thí nghiệm, ngày khối Cũng có chia khối thẳng góc với hướng biến động có ảnh hưởng đến kết thí nghiệm thí dụ hướng gió, hướng chảy nước ngầm, hướng nắng, hướng dốc, hướng thay đổi độ phì đất nhằm loại trừ ảnh hưởng biến động cơng thức có mặt lần mức biến động Một lợi chọn khối khác không gian khác thời gian (nhưng không khác xa đến mức có thay đổi điều kiện thí nghiệm) nên kết luận rút có tính khái qt cao tập trung tồn thí nghiêm vào nơi hay thời gian thí nghiêm kiểu hồn tồn ngẫu nhiên b1- Mơ hình tốn học xi j =  + i +  j + ei j (i =1, a; j=1,r) (2) Khối coi yếu tố hạn chế thường giả thiết ngẫu nhiên, xi j kết mức i khối j,  trung bình chung, i ảnh hưởng mức i nhân tố,  j ảnh hưởng khối j Các sai số e ij giả thiết độc lập, phân phối chuẩn, kỳ vọng 0, phương sai 2 Các tham số thoả mãn điều kiện:  = i i  j = j b2- Các bước tính Tính tổng Nhân tố có a mức bố trí thành r khối Tổng số thí nghiêm (hay số số liệu) n = a r Tổng số liệu công thức i TAi   xij , trung bình x i j TK j   xij Tổng số liệu khối j i Tổng tất số liệu ST =  x i Số điều chỉnh ij j G = ST2 / n Tính tổng bình phương: N D Hien 28 a SSTO  a r  ( x i 1 j 1 r a ij r  x )   x  G SSA   ( xi  x )  i 1 j 1 a ij i 1 j 1  TA i i 1 r G r a r SSK   ( x j  x )   TK j 1 a i 1 j 1 SSE j G = SSTO- SSA - SSK Tính bậc tự do: Bậc tự SSTO Bậc tự SSA dfTO = n - = a r - dfA = a - Bậc tự SSK dfK = r -1 Bậc tự SSE dfE = (a - 1)( r -1) = dfTO - dfA - dfK Tính bình phương trung bình: msK = SSK / dfK msA = SSA / dfA msE = SSE / dfE Chia msK cho msE F tnK Tìm giá trị tới hạn FltK = F(,dfK,dfE) Chia msA cho msE F tnA Tìm giá trị tới hạn FltA = F(,dfA,dfE) Sai số thí nghiệm se bậc hai msE, bậc tự dfE = (a-1)(r-1) Tóm tắt kết vào bảng phân tích phương sai Phân tích phương sai khối ngẫu nhiênđầy đủ Nguồn biến động Tổng Khối BP SSK Nhân tố SSA Sai số SSE Toàn SSTO BTD dfK a-1 dfA k-1 dfE (a-1)(r-1) dfTO a( r –1) Bình phương Tbinh msK SSK/dfK msA SSA/dfA MsE = se2 SSE/dfE Ftn Flt msK/msE F(,dfK,dfE) msA/msE F(,dfA,dfE) b3- Kết luận Dùng bảng phân tích phương sai để kiểm định giả thiết H 0:“Khơng có khác trung bình mi”, đối thiết H1: “Có khác trung bình mi” Muốn kết luận phải so FtnA với FltA N D Hien 29 Nếu FtnA FltA chấp nhận H1:“Có khác trung bình mức nhân tố “ Tính sai số thí nghiệm : se2 = msE = SSE / dfE bậc tự dfE = Trung bình tồn x = ST / n Hệ số biến động CV = se * 100/ x Sai số trung bình x se = se n Sai số trung bình cơng thức seA = se = seB = seC = seD r c- KIỂU BỐ TRÍ Ô VUÔNG LA TINH (Latin square) Như thấy có nguồn biến động ảnh hưởng đến khu vực thí nghiệm phải chia khối vng góc với hướng biến động để đảm bảo độ đồng khối Trường hợp bên ngồi có hướng biến động trực giao tác động đến khu vực thí nghiệm(thí nghiệm bố trí sườn núi vừa chịu ảnh hưởng hướng gió, vừa chịu ảnh hưởng độ cao kết thí nghiệm phụ thuộc vào dụng cụ có chất lượng khác vào ngày khác tuần ), gọi hai tác động hai yếu tố hạn chế, phải bố trí thí nghiệm kiểu ô vuông La tinh Gọi yếu tố thứ hàng, yếu tố thứ hai cột (đây cách nói giản đơn bố trí thí nghiệm, thí dụ gọi khối bố trí độ cao khác hàng, khối bố trí vng góc với chiều gió cột giả thiết hướng gió thổi trực giao với độ dốc Gọi dụng cụ hàng, ngày tuần cột trình phân tích phòng thí nghiệm Trong kiểu bố trí vng La tinh số hàng số cột số mức a nhân tố Mỗi mức đuợc bố trí lần hàng lần cột Mức 1(A1) bố trí N D Hien 30 có ký hiệu A, Mức (A2) bố trí có ký hiệu B, mức (A3) bố trí có ký hiệu C, mức (A4) bố trí ô ký hiệu D Căn vào số mức a ta chọn sơ đồ ô vng La tinh a x a có sẵn tài liệu thống kê, sau đổi chỗ ngẫu nhiên hàng, đổi chỗ ngẫu nhiên cột, để cuối sơ đồ ô vuông La tinh cụ thể để bố trí thí nghiệm Ơ vng La tinh đơn giản, dễ tính, loại trừ ảnh hưởng hướng biến động, nên dùng nắm hai hướng biến động trực giao chấp nhận mơ hình cộng tính (xem phần dưới) Nhược điểm vng La tinh số bậc tự lại cho sai số q thường dùng vng La tinh tối thiểu x khơng nên q to phức tạp khó đảm bảo điều kiện mơ hình c1- Mơ hình tốn học Mơ hình có dạng Xij l =  + i +  j +  l + ei j (3) (i i=1, a;  j j =1, a ;  l l = 1, a) Hàng, cột công thức coi nhân tố cố định xi j l kết mức l bố trí hàng i , cột j, i ảnh hưởng hàng i,  j ảnh hưởng cột j,  l ảnh hưởng công thức l Các sai số e ij giả thiết độc lập, phân phối chuẩn, có kỳ vọng 0, phương 2 Các tham số thoả mãn điều kiện:  i = i  j =  k = k j Gọi a số mức nhân tố Tất có n = a2 thí nghiệm c2- Các bước tính Tính tổng: Tổng số thí nghiêm (hay số số liệu) a = 4; n = a x a Tổng số liệu hàng i THi= a x j 1 N D Hien i jl (tổng xi j l hàng i ) 31 a Tổng số liệu cột j TCj =  xi j l (tổng x i j l cột j) j 1 Tổng số liệu công thức l a x TAl = ( tổng xi j l ứng với công thức l ) i jl l 1 ST=  xi j l Tổng tất số liệu i j (tổng tất x i j l bảng) l Số điều chỉnh G = ST2 / n Tính tổng bình phương:  x SSTO = i j  TC SSC = i jl - G SSH = /a- G  TA l SSA = /a - G /a- G l j SSE i i l j  TH = SSTO - SSA - SSH - SSC Tính bậc tự do: Bậc tự SSTO dfTO = n -1 Bậc tự SSA dfA = a -1 Bậc tự SSH dfH = a -1 Bậc tự SSC dfC = a -1 Bậc tự SSE dfE = n - 3(a-1) = (a-1)(a-2) Tính bình phương trung bình: msH =SSH/dfH ; msA = SSA/dfA; msC = SSC/dfC; msE = SSE/dfE = se2 Giá trị F thực nghiệm FtnA = msA / msE, giá trị tới hạn FltA= F(, dfA, dfE) Bảng phân tích phương sai Nguồn biến động TổngBP BTD Tbình Hàng SSH a-1 msH Cột SSC a-1 msC Nhân tố SSA a-1 msA Sai số SSE dfE msE Toàn SSTO dfTO Ftn Flt FltA FtnA F(α,dfA,dfE) c3- Kết luận So FtnA với FltA mức ý nghĩa  với dfA dfE bậc tự N D Hien 32 Nếu FtnA FltA kết luận: “Có khác trung bình mức nhân tố” Tính sai số thí nghiệm se: se2 = msE = SSE / dfE bậc tự dfE = Trung bình tồn x = ST / n Hệ số biến động CV = se * 100/ x Sai số trung bình x se = se n Sai số trung bình cơng thức seA = se a = seB = seC = seD Trên kiểu bố trí thí nghiệm khảo sát nhân tố Để khảo sát nhân tố mà cần phải chia thành khối ngồi kiểu bố trí khối đầy đủ kiểu khối khơng đầy đủ (Randomized incomplete Block design) đáng ý loại khơng đầy đủ cân đối (Balanced incomplete block design) lưới ô vuông (Lattice design, hay dùng nghiên cứu ban đầu giống) Để khảo sát nhân tố có hai yếu tố hạn chế (hai nguồn biến động trực giao) ngồi vng La tinh kiểu vng La tinh thiêú (chữ nhật Youden ) Khi có yếu tố hạn chế dùng ô vuông La tinh Hy lạp(Graeco-Latin squares) II- XỬ LÝ TRONG SPSS a- Phân tích phương sai nhân tố kiểu CRD Mở tệp Baitap3 Vào Analyse Compare means One way anova Chọn Tluong (trọng lượng) vào Dependent list (danh sách biến phụ thuộc), Factor (nhân tố) chọn diet (thức ăn) N D Hien 33 Trong Options chọn Descriptive Homogeneity of variance test Means plot Trong Post hoc (kiểm định sau phân tích phương sai) chọn LSD, Tukey Duncan N D Hien 34 Kết Descriptives tluong N Std Deviation Mean Std Error Mini mum Maxi mum 79.00 24.474 10.945 48.61 109.39 38 99 71.00 31.024 13.874 32.48 109.52 30 112 81.40 22.876 10.230 53.00 109.80 42 97 20 142.80 93.55 34.903 39.523 15.609 8.838 99.46 75.05 186.14 112.05 85 30 169 169 Total Tluong Test of Homogeneity of Variances Levene Statistic df1 386 df2 Tluong N D Hien 95% Confidence Interval for Mean Lower Upper Bound Bound Sig 16 765 ANOVA Between Groups Sum of Squares 16466.950 Mean Square 5488.983 Within Groups 13212.000 16 825.750 Total 29678.950 19 df F 6.647 Sig .004 35 Phân chia nhóm theo Tukey Duncan Vẽ trung bình Có thể phân tích phương sai General linear model Vào General linear model Univariate sau làm giống one way anova Chọn Dependent variable Tluong, fixed factor diet N D Hien 36 Trong Model chọn Full factorial, chọn Custom phải đưa diet sang khung model, nháy include intercept in model không nháy SPSS chọn sẵn cách phân tích theo kiểu phân tích Sum of squares type III Trong options chọn Descriptives Statistics Homogeneity tests để kiểm tra mơ hình N D Hien 37 Trong Post hoc chọn LSD, Tukey Duncan one way anova Kết giống one way anova b- Phân tích phương sai nhân tố kiểu khối ngẫu nhiên (RCBD) Vào General linear model univariate Chọn biến tluong2 vào Dependent variable, chọn khoi congthuc vào Fixed factor N D Hien 38 Trong Model chọn Custom đưa khoi congthuc sang khung model, nháy ô include intercept in model không nháy SPSS chọn sẵn cách phân tích theo kiểu phân tích Sum of squares type III Trong post hoc chọn Post hoc tets for Congthuc sau chọn LSD, Tukey, Duncan N D Hien 39 Kết quả: Dependent Variable: tluong2 Tests of Between-Subjects Effects Source Corrected Model Type III Sum of Squares df Mean Square F Sig 8.249(a) 1.178 22.198 000 Intercept 711.625 711.625 13405.799 000 congthuc 1.846 615 11.589 001 olon 6.403 1.601 30.155 000 Error 637 720.510 12 20 053 8.886 19 Total Corrected Total a R Squared = 928 (Adjusted R Squared = 886) N D Hien 40 Nếu sau vào General model Univariate khai báo Congthuc vào Fixed factor khoi vào Random factor có kết tương tự Tests of Between-Subjects Effects Dependent Variable: tluong2 Source Intercept congthuc Type III Sum of Squares Hypothesis Mean Square 711.625 711.625 Error 6.403 1.601(a) Hypothesis 1.846 615 Error o_lon df Hypothesis Error 637 12 053(b) 6.403 1.601 637 12 053(b) F Sig 444.557 000 11.589 001 30.155 000 a MS(o_lon) b MS(Error) c- Phân tích phương sai nhân tố kiểu ô vuông La tinh (LS) Analyse General linear model Univariate Đưa Yield vào Dependent variable, đưa trset, row, column vào Fixed factor Trong Model chọn Custom đưa Row, Column, treat sang model Trong Post hoc chọn Post hoc test for Treat N D Hien 41 Dependent Variable: Yield Tests of Between-Subjects Effects Source Model Row Type III Sum of Squares 113372.675(a ) 2326.386 df Mean Square F Sig 13 8720.975 517.936 000 581.597 34.541 000 901.374 225.344 13.383 000 1284.510 321.128 19.072 000 Error 202.055 12 16.838 Total 113574.730 25 Col Treat a R Squared = 998 (Adjusted R Squared = 996) N D Hien 42 N D Hien 43 ... F(,dfA,dfE) Sai số thí nghiệm se bậc hai msE, bậc tự dfE = (a-1)(r-1) Tóm tắt kết vào bảng phân tích phương sai Phân tích phương sai khối ngẫu nhiênđầy đủ Nguồn biến động Tổng Khối BP SSK Nhân tố SSA Sai. .. SSE j G = SSTO- SSA - SSK Tính bậc tự do: Bậc tự SSTO Bậc tự SSA dfTO = n - = a r - dfA = a - Bậc tự SSK dfK = r -1 Bậc tự SSE dfE = (a - 1)( r -1 ) = dfTO - dfA - dfK Tính bình phương trung bình:... /a - G /a- G l j SSE i i l j  TH = SSTO - SSA - SSH - SSC Tính bậc tự do: Bậc tự SSTO dfTO = n -1 Bậc tự SSA dfA = a -1 Bậc tự SSH dfH = a -1 Bậc tự SSC dfC = a -1 Bậc tự SSE dfE = n - 3(a-1)

Ngày đăng: 30/01/2020, 18:37

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan