34 Bài tập xử lý số liệu trên phần mềm R

54 1K 2
34 Bài tập xử lý số liệu trên phần mềm R

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ MÔN: THỰC HÀNH XỬ LÝ SỐ LIỆU THỰC NGHIỆM TRONG PHỊNG THÍ NGHIỆM BÀI TẬP TIN HỌC ỨNG DỤNG GVHD: PHẠM MINH TUẤN NHÓM: LỚP: ĐHTP8B DANH SÁCH NHÓM STT BÀI 1: HỌ VÀ TÊN Nguyễn Thị Vân Đặng Thị Nhung Lê Thị Hồng Liên Hồng Hữu Trung Trương Cơng Vũ MSSV 12064671 12089271 12054971 12128641 12001685 BÀI TẬP TIN HỌC ỨNG DỤNG - p-value = 0.8701>0,05 cho thấy khơng có khác biệt hiệu suất trích ly loại dung mơi - mức ý nghĩa α=5% Có thể chọn loại dung môi (diethyl eter, cồn) để trích ly polyphenol Tuy nhiên theo ý kiến cá nhân, ta nên chọn cồn giá thành rẻ khơng gây ảnh hưởng nhiều tới sức khỏe PHỤ LỤC: >hieusuatdungmoi data1plot(data1) > shapiro.test(hieusuat) # p-value = 0.7311 >0.05 nên hiệu suất trích ly dung mơi tuân theo luật phân phối chuẩn BÀI TẬP TIN HỌC ỨNG DỤNG >var.test(hieusuat~dungmoi) # p-value =0.06226 >0.05 nên khác biệt phương sai hai loại dung môi > t.test(hieusuat~dungmoi,var.equal=T) # p-value = 0.8701 BÀI 2: p-value = 1.319e-07 < 0.05 nên thời gian bền bọt hki sử dụng CMC có ý nghĩa thống kê mức 0.05 Khi sử dụng phụ gia, thời gian bền bọt đạt 1.22h cao thời gian bền bọt mẫu đối chứng 0.05h Nên phụ gia CMC có tác dụng kéo dài thời gian bền bọt Vì sử dụng loại phụ gia chế biến PHỤ LỤC: >dc=c(1.10,0.99,1.05,1.01,1.02,1.07,1.10,0.98,1.03, 1.12) >CMC=c(1.25,1.31,1.28,1.20,1.18,1.22,1.22,1.17,1.19, 1.21) > t.test(dc,CMC,paired=TRUE) Paired t-test data: dc and CMC t = -8.7467, df = 9, p-value = 1.078e-05 alternative hypothesis: true difference in means is not equal to 95 percent confidence interval: BÀI TẬP TIN HỌC ỨNG DỤNG -0.2215188 -0.1304812 sample estimates: mean of the differences -0.176 BÀI: Loại Enzyme A B C D Lượng acid amin tổng số 18.17c +1.17 a 14.80 +0.84 c 19.00 +0.82 ab 16.25 +1.17 Chú thích: kí tự a,b,c cột để khác biệt lượng acid amin tổng số nước mắm sử dụng loại enzyme thủy phân khác BIỂU ĐỒ: khả thủy phân loại enzyme(Trong 1=A;2=B; 3=C;4=D) Qua kết p-value=7.463e-05acidamin=c(17,18,17,20,19,18,14,15,16,15,14,19,20,18 , 19,16,15,16,18) >group=c(rep("A",6),rep("B",5),rep("C",4),rep("D",4)) > group=as.factor(group) > analysis=lm(acidamin~group) > anova(analysis) Analysis of Variance Table Response: acidamin Df Sum Sq Mean Sq F value group 50.564 16.8547 Residuals 15 16.383 Pr(>F) 15.431 7.463e-05 *** 1.0922 Signif codes: 0.1 ‘ ’ ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ > av=aov(acidamin~group) > TukeyHSD(av) diff lwr upr p adj B-A -3.3666667 -5.1905943 -1.5427391 0.0004459 C-A 0.8333333 -1.1109800 2.7776467 0.6151972 D-A -1.9166667 -3.8609800 0.0276467 0.0539882 C-B 4.2000000 2.1794103 6.2205897 0.0001307 D-B 1.4500000 -0.5705897 3.4705897 0.2079384 D-C -2.7500000 -4.8798886 -0.6201114 0.0098498 BÀI TẬP TIN HỌC ỨNG DỤNG BÀI 4: Nồng độ phụ gia(%) 0.5 0.3 0.1 Đường kính bánh 71.14 a +_ 6.89 63.71 ab +_ 6.63 61.14 b +_ 7.15 Chú thích: kí tự a,b,c cột để khác biệt khả trương nở bánh nồng độ phụ gia sử dụng khác Biểu đồ thể phụ thuộc khả trương nở nồng độ phụ gia Theo kết ta thấy giá trị p-value=0.037phugia=c(68,80,69,76,68,77,60,71,62,58,74,65,59, 57,58,60,70,51,57,71,61) >group=gl(3,7) >groupdataanalysisanova(analysis) # p- value =0.037resTukeyHSD(res) 2-1 -7.428571 -16.83138 1.9742350 0.1369187 BÀI TẬP TIN HỌC ỨNG DỤNG 3-1 -10.000000 -19.40281 -0.5971936 0.0361071 3-2 -2.571429 -11.97423 6.8313778 0.7677005 BÀI 5: Dựa vào phép kiểm định t.test mẫu thử nghiệm mẫu đối chứng có p-value = 4.327e-05 dc=c(3.45,3.58,3.59,3.62,3.59,3.57,3.35,3.74,3.29,3 48,3.45,3.58,3.59,3.62,3.59,3.57,3.35,3.74,3.29,3.48, 3.45,3.58,3.59,3.62,3.59,3.57,3.35,3.74,3.29,3.48,3.4 5,3.58,3.59,3.62,3.59) >tn=c(3.57,3.57,3.59,3.58,3.67,3.69,3.74,3.58,3.74,3 75,3.61,3.78,3.67,3.69,3.35,3.58,3.68,3.59,3.58,3.58, 3.68,3.59,3.58,3.74,3.75,3.61,3.78,3.67,3.69,3.74,3.5 8,3.68) >t.test(dc,tn) # p-value = 4.327e-05 BÀI 6: > khongthich=c(15,33) > thich=c(132,145) BÀI TẬP TIN HỌC ỨNG DỤNG > t.test(khongthich,thich,paired=T) > # p-value = 0.0139 (data6=matrix(c(15,132,33,145),2,2,dimnames=list(c("K hongthich","Thich"),c("Huongchanhday","Huongvani"))) > barplot(data6,col="green") KẾT LUẬN: - Mức độ ưa thích hương chanh dây: 132/ - (15+132)*100 = 87,79% Mức độ ưa thích hương vani: 145/(33+145)*100 = 81.46% Suy chanh dây có mức độ yêu thích cao nên sử dụng hương chanh dây Biểu đồ thể mức độ yêu thích hương vani hương chanh dây BÀI TẬP TIN HỌC ỨNG DỤNG Biểu đồ thể mức độ yêu thích hương chanh dây hương vani qua số lượng người BÀI 7: VÙNG I II III Hàm lượng saponin (%) 7.19c +_ 0.43 a 4.22 +_ 2.88 b 5.48 +_ 2.42 Chú thích: kí tự a,b,c cột để khác biệt hàm lượng saponin lấy nhân sâm vùng khác Qua giá trị p-value=0.584> 0.05 cho thấy có khác biệt hàm lượng saponin thu vùng mức ý nghĩa 0.05 để thu hàm lượng saponin cao hiệu đề nghị lấy nhân sâm vùng I Biểu đồ thể hàm lượng trung bình nhân sâm tùy vào vùng trồng PHỤ LỤC: >saponin=c(7.53,6.87,7.12,7.53,6.84,6.67,7.81,5.87, 5.64,6.14,6.07,5.79,6.13,6.35,6.5,6.49,6.55,6.63) >group data3shapiro.test(saponin) # p-value = 0.584> 0.05 nên bảng số liệu tuân theo phân phối chuẩn >analysisanova(analysis) # p- value resTukeyHSD(res) diff lwr upr p adj 2-1 -1.2937143 -1.76514063 -0.8222879 0.0000098 3-1 -0.7540476 -1.20197156 -0.3061237 0.0014894 3-2 0.5396667 0.05214608 1.0271873 0.0293357 BÀI 8: Nếu nhân viên R & D tơi chọn tính chất sau Độ sản phẩm Độ màu sản phẩm Hương sản phẩm Hương sản phẩm Vị mặn sản phẩm PHỤ LỤC: > dotrong1 = c(7,6,7,8,9,7,8,9,7,8) > dotrong2= c(6,5,5,6,4,5,6,7,5,6) >t.test(dotrong1,dotrong2) # p-value = 6.895e-05 trung bình dotrong2 =5.5 Nên tơi chọn dotrong1(độ sản phẩm 1) 10 BÀI TẬP TIN HỌC ỨNG DỤNG diff lwr upr p adj 2-1 -4.20 -4.970694 -3.42930599 0.0000043 3-1 -8.70 -9.470694 -7.92930599 0.0000001 4-1 3.00 2.229306 3.77069401 0.0000368 5-1 -0.85 -1.620694 -0.07930599 0.0326881 6-1 -6.50 -7.270694 -5.72930599 0.0000007 3-2 -4.50 -5.270694 -3.72930599 0.0000032 4-2 7.20 6.429306 7.97069401 0.0000004 5-2 3.35 2.579306 4.12069401 0.0000180 6-2 -2.30 -3.070694 -1.52930599 0.0001747 4-3 11.70 10.929306 12.47069401 0.0000000 5-3 7.85 7.079306 8.62069401 0.0000002 6-3 2.20 1.429306 2.97069401 0.0002250 5-4 -3.85 -4.620694 -3.07930599 0.0000071 6-4 -9.50 -10.270694 -8.72930599 0.0000000 6-5 -5.65 -6.420694 -4.87930599 0.0000014 > by(a,group,mean) group: [1] 12.6 group: [1] 8.4 group: [1] 3.9 group: [1] 15.6 group: [1] 11.75 group: [1] 6.1 40 BÀI TẬP TIN HỌC ỨNG DỤNG BÀI 32: Nếu bỏ qua ảnh hưởng giống lúa lên suất -Bảng : Giá trị loại đất Lô đất 31.55 Lô đất 31.63 +- 3.01 Lô đất 33.93 +- 2.87 Lô đất 33.23 +- Lô đất 33.90 Qua phép kiểm định anova ta thấy +- 1.85 3.48 +- 3.50 p-value=0.6551 > 0.05 nên ko có khác biệt có ý nghĩa thống kê giũa nhóm mức ý nghĩa anpha =5% nên chọn lơ đất PHỤ LỤC: > group group=as.factor(group) > a=c(32.8,33.3,30.8,29.3,34,30,34.3,28.2,34.3,36.3,35 3,29.8,35,36.8,32.3,28.8,36.5,34.5,35.8,28.8) > kq=data.frame(group,a) > attach(kq) > analysis=lm(a~group) > anova(analysis) 41 BÀI TẬP TIN HỌC ỨNG DỤNG Df group Sum Sq Mean Sq F value Pr(>F) 22.357 5.5893 Residuals 15 135.212 9.0142 0.6201 0.6551 > res=aov(a~group) > TukeyHSD(res) diff lwr upr p adj 2-1 0.075 -6.48063 6.63063 0.9999996 3-1 2.375 -4.18063 8.93063 0.7944543 4-1 1.675 -4.88063 8.23063 0.9298920 5-1 2.350 -4.20563 8.90563 0.8004375 3-2 2.300 -4.25563 8.85563 0.8121928 4-2 1.600 -4.95563 8.15563 0.9398952 5-2 2.275 -4.28063 8.83063 0.8179607 4-3 -0.700 -7.25563 5.85563 0.9971524 5-3 -0.025 -6.58063 6.53063 1.0000000 5-4 0.675 -5.88063 7.23063 0.9975270 Nếu xét ảnh hưởng giống lúa khu vực canh tác lên suất thu hoạch Qua phép kiểm định anova ta thấy p-value đất =0.5985 > 0.05,p-value giống=0.2096 > 0.05 nên khơng có sai khác ý ngĩa thống kê mức anpha=5% nhóm nên chọn nhóm PHỤ LỤC: 42 BÀI TẬP TIN HỌC ỨNG DỤNG >dat=gl(5,4,20) >giong=gl(4,5,20) >id=1:20 >score=c(32.8,33.3,30.8,29.3,34,30,34.3,28.2,34.3,36 3,35.3,29.8,35,36.8,32.3,28.8,36.5,34.5,35.8,28.8) >dataattach(data) >anova(lm(score~dat+giong) ) Df Sum Sq Mean Sq F value Pr(>F) dat 22.357 5.5893 0.7134 0.5985 giong 41.191 13.7303 1.7524 0.2096 BÀI 33: # tác động riêng rẽ giống môi trường đến khả cho sinh khối tươi chủng nấm men bánh mì *GIỐNG: GIỐNG Năng suất cho sinh khối (g) 10.9 a +4.49 b 13.6 +4.19 a 9.89 +3.25 a b 11.8 +3.7 b 12.67 +3.43 c 15.3 +4.97 Chú thích: kí tự a,b,c dòng để khác biệt khả cho sinh khối tươi chủng nấm men khác P –value=2.2e-16score=c(5.112,5.066,4.987,5.786,6.562,6.378,4.258,3 129,5.024,5.231,5.124,5.358,6.587,6.786,6.841,7.068,7 257,7.524,11.235,12.481,12.547,12.021,12.046,12.008, 44 BÀI TẬP TIN HỌC ỨNG DỤNG 11.547,11.787,12.002,11.958,12.548,12.032,13.245,14.8 47,14.023,14.568,15.618,15.097,14.056,14.648,14.358,1 4.978,15.092,15.642,12.321,12.819,12.458,15.647,16.55 0,16.542,14.562,14.734,15.023,15.003,14.347,14.175,16 542,16.95,16.724,17.687,18.572,18.235,9.687,7.566,8 654,13.214,14.866,14.035,15.698,17.214,16.571,20.158, 24.75,22.547,7.023,6.219,6.354,15.874,16.830,16.325,1 2.358,12.21,12.564,11.369,11.657,11.587,11.387,11.553 ,10.987,16.871,17.161,17.289) > data=data.frame(moitruong,giong,id,score) > attach(data) > twoway=lm(score~moitruong + giong) > anova(twoway) # Qua trung bình bình phương(mean square),tơi nhận thấy ảnh hưởng mơi trường quan trọng ảnh hưởng giống.Tuy nhiên, hai ảnh hưởng có ý nghĩa thống kê mức ý nghĩa anpha = 5% trị số P thấp cho hai yếu tố( moitruong:P-value= 2.2e-16;going: P-value= 5.21e-09) >anova( twowayF) moitruong 1125.81 281.451 699.217 < 2.2e-16 giong 278.79 55.758 138.520 < 2.2e-16 moitruong:giong 20 330.90 16.545 41.103 < 2.2e-16 # Sự tương tác giống môi trường P-value=2.2e-16 res=aov(score~moitruong+giong) > res=aov(score~moitruong+giong) > TukeyHSD(res) Fit: aov(formula = score ~ moitruong + giong) $moitruong diff lwr 2-1 7.0851111 5.1252181 3-1 8.8265000 6.8666070 10.7863930 0.0000000 4-1 10.3106667 8.3507736 12.2705597 0.0000000 5-1 6.7522222 4.7923292 8.7121153 0.0000000 3-2 1.7413889 -0.2185041 3.7012819 0.1055540 4-2 3.2255556 1.2656625 5.1854486 0.0001532 5-2 -0.3328889 -2.2927819 1.6270041 0.9894838 4-3 3.4440597 0.2245574 1.4841667 -0.4757264 upr p adj 9.0450041 0.0000000 5-3 -2.0742778 -4.0341708 -0.1143847 0.0326370 5-4 -3.5584444 -5.5183375 -1.5985514 0.0000247 $giong diff lwr 2.6489333 0.4027711 4.8950956 0.0114153 3-1 -1.0612000 -3.3073622 1.1849622 0.7390421 4-1 3.1405622 0.8530289 2-1 0.8944000 -1.3517622 upr p adj 46 BÀI TẬP TIN HỌC ỨNG DỤNG 5-1 1.7170667 -0.5290956 3.9632289 0.2348854 6-1 4.3420667 6.5882289 0.0000036 2.0959044 3-2 -3.7101333 -5.9562956 -1.4639711 0.0000950 4-2 -1.7545333 -4.0006956 0.4916289 0.2140833 5-2 -0.9318667 -3.1780289 1.3142956 0.8300814 6-2 1.6931333 -0.5530289 3.9392956 0.2488588 4-3 1.9556000 -0.2905622 4.2017622 0.1243464 5-3 2.7782667 0.5321044 5.0244289 0.0067840 6-3 5.4032667 3.1571044 7.6494289 0.0000000 5-4 0.8226667 -1.4234956 3.0688289 0.8920120 6-4 3.4476667 1.2015044 5.6938289 0.0003424 6-5 2.6250000 0.3788378 4.8711622 0.0125404 BÀI 34: PHỤ LỤC: >tl=gl(5,15,75) >tg=gl(5,3,75) >hs=c(40.41,42.50,39.50,45.58,45.21,46.67,47.27,47.36 ,48.79,49.44,49.53,50.53,49.74,50.17,51.17,37.38,37.4 7,38.47,49.56,49.65,50.56,50.91,51.00,52.00,53.75,53 55,54.55,54.54,54.63,55.63,45.91,46.00,47.00,54.24,54 33,55.33,59.49,59.58,60.58,60.65,60.74,61.74,61.04,6 1.13,62.13,52.04,52.13,53.13,62.26,62.35,63.35,68.17, 68.26,69.26,74.44,74.53,75.53,76.36,76.45,77.45,59.86 ,59.95,60.95,68.52,68.61,69.61,73.68,73.77,74.77,78.8 5,78.94,79.94,79.47,79.56,80.56) >dat= data.frame(tl,tg,hs) 47 BÀI TẬP TIN HỌC ỨNG DỤNG >twowayanova(twoway) Df Sum Sq Mean Sq F value Pr(>F) tl 7277.9 1819.48 383.35 < 2.2e-16 tg 2916.5 153.62 < 2.2e-16 729.11 #cả2 yếu tố tỷ lệ(tl)và thời gian xay(tg)đều có Pvalue< 2.2e-16,nên có ảnh hưởng đến hiệu suất xay mức ý nghĩa 5%,tuy nhiên ảnh hưởng yếu tố tỷ lệ mạnh thời gia xay(MeanSq tl=1819.48> MeanSq tg) > anova(twowayF) tl 7277.9 1819.48 3871.787 < 2.2e-16 tg 2916.5 tl:tg 16 289.8 729.11 1551.527 < 2.2e-16 18.11 38.536 < 2.2e-16 # tương tác cộng gộp tl:tg có ảnh hưởng đến hiệu suất xay (P-value< 2.2e-16)ở mức ý nghĩa 5% tác động cộng gộp thấp so với tác động riêng rẽ yếu tố(MeanSq tl:tg=18.11) # tác động riêng rẽ yếu tố đến hiệu suất xay >resTukeyHSD(res) Fit: aov(formula = hs ~ tl + tg) $tl (tỷ lệ) diff lwr upr p adj 2-1 2.652000 0.4209105 4.883089 0.0118786 3-1 9.734667 7.5035772 11.965756 0.0000000 4-1 20.122667 17.8915772 22.353756 0.0000000 5-1 25.544667 23.3135772 27.775756 0.0000000 48 BÀI TẬP TIN HỌC ỨNG DỤNG 3-2 7.082667 4.8515772 9.313756 0.0000000 4-2 17.470667 15.2395772 19.701756 0.0000000 5-2 22.892667 20.6615772 25.123756 0.0000000 4-3 10.388000 8.1569105 12.619089 0.0000000 5-3 15.810000 13.5789105 18.041089 0.0000000 5-4 5.422000 3.1909105 7.653089 0.0000000 $tg(thời gian) diff 2-1 lwr 8.875333 upr p adj 6.644244 11.106423 0.0000000 3-1 12.812667 10.581577 15.043756 0.0000000 4-1 16.267333 14.036244 18.498423 0.0000000 5-1 17.155333 14.924244 19.386423 0.0000000 3-2 3.937333 1.706244 6.168423 0.0000522 4-2 7.392000 5.160911 9.623089 0.0000000 5-2 8.280000 6.048911 10.511089 0.0000000 4-3 3.454667 1.223577 5.685756 0.0004635 5-3 4.342667 2.111577 6.573756 0.0000076 5-4 0.888000 -1.343089 3.119089 0.7974094 49 ... LỤC: >B=c(rep(205,7),rep(215,9),rep(225,8),rep(235,8),rep( 245,14),rep(255,11),rep(265,6),rep(275,5)) >A=c(rep(205,14),rep(215,21),rep(225,20),rep(235,13), rep(245,5),rep(255,4),rep(265,3),rep(275,2))... 0.05 ‘.’ 0.1 ‘ ’ Residual standard error: 0.0128 on degrees of freedom Multiple R- squared: 0.9993, Adjusted R- squared: 0.9991 F-statistic: 4532 on and DF, p-value: 7.223e-06 35 BÀI TẬP TIN HỌC ỨNG... >group= gl(6,3) >group= as.factor(group) >data= data.frame(group,vtmc) > analysis=lm(vtmc~group) >analysisanova(analysis) # Pr(>F)= 2.57e-16 >res= aov(vtmc~group) >TukeyHSD(res)

Ngày đăng: 07/11/2015, 22:18

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan