34 Bài tập xử lý số liệu trên phần mềm R

Khi sử dụng phụ gia, thời gian bền bọt của đạt 1.22h cao hơnthời gian bền bọt của mẫu đối chứng 0.05h.. lượng acid amin đạt cao nhất khi sử dụng enzyme C và hàm lượng này theo thống kê k

Trang 1

TRONG PHÒNG THÍ NGHIỆM

GVHD: PHẠM MINH TUẤN NHÓM: 4

Trang 2

- p-value = 0.8701>0,05 cho thấy không có sự khác

biệt về hiệu suất trích ly của 2 loại dung môi ởmức ý nghĩa α=5%

- Có thể chọn cả 2 loại dung môi này (diethyl eter,

cồn) để trích ly polyphenol Tuy nhiên theo ýkiến cá nhân, ta nên chọn cồn vì giá thành rẻ vàkhông gây ảnh hưởng nhiều tới sức khỏe

# p-value = 0.7311 >0.05 nên hiệu suất trích ly của

2 dung môi tuân theo luật phân phối chuẩn

Trang 3

# p-value =0.06226 >0.05 nên không có sự khác biệt

về phương sai của hai loại dung môi

p-value = 1.319e-07 < 0.05 nên thời gian bền bọt hki

sử dụng CMC có ý nghĩa thống kê ở mức 0.05 Khi sử dụng phụ gia, thời gian bền bọt của đạt 1.22h cao hơnthời gian bền bọt của mẫu đối chứng 0.05h Nên phụ gia CMC có tác dụng kéo dài thời gian bền bọt Vì vậy

có thể sử dụng loại phụ gia này trong chế biến

PHỤ LỤC:

>dc=c(1.10,0.99,1.05,1.01,1.02,1.07,1.10,0.98,1.03,1.12)

>CMC=c(1.25,1.31,1.28,1.20,1.18,1.22,1.22,1.17,1.19,1.21)

> t.test(dc,CMC,paired=TRUE)

Trang 5

0 2 4 6 8 10 12 14 16 18 20

kê ở mức anpha=0.05 lượng acid amin đạt cao nhất khi

sử dụng enzyme C và hàm lượng này theo thống kê không

có sự khác biệt khi sử dụng enzyme A, C nhưng lại có

sự khác biệt khi sử dụng enzyme B,D vì vậy để đạt hiệu quả cao chúng tôi đề nghị sử dụng enzyme C để thủy phân trong quá trình sản xuất nước mắm

PHỤ LỤC:

>acidamin=c(17,18,17,20,19,18,14,15,16,15,14,19,20,18, 19,16,15,16,18)

Trang 7

56 58 60 62 64 66 68 70 72

Trang 8

2-1 -7.428571 -16.83138 1.9742350 0.1369187

3-1 -10.000000 -19.40281 -0.5971936 0.0361071

3-2 -2.571429 -11.97423 6.8313778 0.7677005

BÀI 5:

Dựa vào phép kiểm định t.test giữa mẫu thử nghiệm

và mẫu đối chứng chúng ta có p-value = 4.327e-05

<,0.05 nên có sự khác biệt về ý nghĩa thống kê giữa hai yếu tố ở mức ý nghĩa thống kê anpha= 5%.Do đó,có

sự khác biệt giữa hàm lượng izozym EST trong máu

những người tiếp xúc lâu dài, trực tiếp với hóa chất với những người không tiếp xúc trực tiếp với hóa

chất

PHỤ LỤC:

>dc=c(3.45,3.58,3.59,3.62,3.59,3.57,3.35,3.74,3.29,3.48,3.45,3.58,3.59,3.62,3.59,3.57,3.35,3.74,3.29,3.48,3.45,3.58,3.59,3.62,3.59,3.57,3.35,3.74,3.29,3.48,3.45,3.58,3.59,3.62,3.59)

>tn=c(3.57,3.57,3.59,3.58,3.67,3.69,3.74,3.58,3.74,3.75,3.61,3.78,3.67,3.69,3.35,3.58,3.68,3.59,3.58,3.58,3.68,3.59,3.58,3.74,3.75,3.61,3.78,3.67,3.69,3.74,3.58,3.68)

>t.test(dc,tn)

# p-value = 4.327e-05

BÀI 6:

> khongthich=c(15,33)

Trang 9

> thich=c(132,145)

> t.test(khongthich,thich,paired=T)

> # p-value = 0.0139 (<0.05) cho thấy sự khác biệt vềmức độ cảm quan của mứt rau câu khi sử dụng 2 loại hương liệu (hương chanh dây và hương vani) có sự khácbiệt có ý nghĩa thống kê ở mức ý nghĩa = 5%

>data6=matrix(c(15,132,33,145),2,2,dimnames=list(c("Khongthich","Thich"),c("Huongchanhday","Huongvani")))

Trang 10

Qua giá trị p-value=0.584> 0.05 cho thấy có sự khác

biệt về hàm lượng saponin thu được giữa 3 vùng ở mức

ý nghĩa 0.05 để thu được hàm lượng saponin cao nhất

và hiệu quả nhất chúng tôi đề nghị lấy nhân sâm ởvùng I

Trang 11

0 1 2 3 4 5 6 7 8

>group<- as.factor (rep(1:3,c(7,5,6)))

Trang 12

Nếu tôi là nhân viên R & D tôi sẽ chọn các tính chất sau

Độ trong sản phẩm 1

Độ màu sản phẩm 1 Hương sản phẩm 1 hoặc Hương sản phẩm 2

# p-value = 6.895e-05 <0.05 ,có sự khác biệt giữa

dotrong1 và ddootrong2 ở mức ý nghĩa anpha = 5%.Bên cạnh đó trung bình cua dotrong1 =7.6 >trung bình của dotrong2 =5.5 Nên tôi chọn dotrong1(độ trong của sảnphẩm 1)

> domau1 <- c(8,7,8,9,9,8,6,7,8,7)

> domau2 <- c(5,6,5,7,5,4,6,5,6,5)

>t.test(domau1,domau2)

# p-value = 2.074e-05 <0.05.có sự khác biệt có ý

nghĩa ở mức anpha= 5% giữa domau1 và đomau2.Mặt khác trung bình của domau1= 7.7> trung bình của domau2= 5.4 nên tôi chọn domau1(độ màu của sản phẩm 1)

> huong1 <- c(8,7,8,7,6,7,7,8,8,9)

Trang 13

> huong2 <- c(7,8,6,5,5,7,8,9,8,8)

>t.test(huong1,huong2)

#p-value = 0.445 >0.05 không có sự khác biệt có ý

nghĩa thống kê ở mức ý nghĩa anpha 5% giữa huong1 và huong2 Vậy chọn huong1 hoặc huong2 đều được

> viman1 <- c(8,6,7,6,7,8,7,6,7,6)

> viman2 <- c(7,8,7,8,9,7,8,8,9,8)

>t.test(viman1,viman2)

#p-value = 0.004765 <0.05 có sự khác biệt có ý nghĩa

ở mức anpha= 5% giữa viman1 va viman2 Mặt khác trungbình của viman1= 6.8< trung bình của viman2= 7.9 nên tôi chọn viman2(vị mặn của sản phẩm 2)

Kết luận: p-value =0.0286< 0.05,có sự khác nhau ở mức

ý nghĩa 5% giữa hai sản phẩm A,B.tôi nhận thấy SP A

có tỷ lệ người hài lòng trên tổng số là 0.83> 0.71 là

tỷ lệ người yêu thích SP B,nên tôi sẽ chọn SP A để sửdụng

BÀI 10:

Qua giá trị p value=0.1066>0.05 ta thấy không có sự

khác biệt giữa sản phẩm đang bán và sản phẩm cải

Trang 14

tiến Công ty không nên tung sản phẩm cải tiến ra thịtrường.

Qua giá trị Pr(>F)=6.491e-06 < 0.05 ta thấy có sự

khác biệt hiệu suất trích ly khi thời gian trích ly khác nhau Hiệu suất trích ly thu được không có sự khác biệt khi thời gian trích ly là 100, 115 phút nhưng lại có sự khác biệt khi thời gian là 55, 70, 85phút Để hiệu suất trích ly hiệu quả chúng tôi đề nghị sử dụng enzyme với thời gian trích ly là 100 phút

Trang 15

>y=c(16.77,18.56,17.83,21.52,20.42,21.27,22.16,24.73,23.01,24.92,24.27,23.96,24.73,24.41,25.82)

Trang 16

0 5 10 15 20 25 30

KẾT LUẬN: Năng suất cửa các giống khác nhau không phải do ngẫu nhiên mà do phẩm chất giống( do Pr(>F)= 3.229e-05).năng suất lúa không có sự khác biệt ở

giống 1, 2 nhưng lại có sự khác biệt ở giống 3,4 Để đạt được hiệu quả tốt nhất, chúng tôi đề nghị chọn giống 2 để phổ biến rộng rãi trong sản xuất

Trang 17

0 1 2 3 4 5 6 7 8 9 10

Trang 18

diff lwr upr p adj

enzyme(%)khác nhau

lượng vitaminC (mg/g) ở các nồng độ chế phẩm có sựkhác biệt theo thống kê ở mức alpha =5% Hàm lượngvitamin C đạt giá trị cao nhất(theo chất khô) khi sử

Trang 19

dụng chế phẩm ở nồng độ 0.3% và hàm lượng này theothống kê không có sự khác biệt khi sử dụng chế phẩm ởcác nồng độ (0.15%, 0.2%, 0.25%, 0.3%)tuy nhiên lại

có sự khác biệt so với khi sử dụng ở các nồng độ(0.05%,0.1%) Vì vậy để hàm lượng Vitamin C đạt hiệuquả chúng tôi đề nghị chọn nồng độ là 0.15%

PHỤ LỤC:

>vtm=c(49.02,48.33,52.14,76.43,78.64,79.31,88.65,90.52,87.94,90.75,92.51,91.96,93.56,94.42,94.99,95.23,97.12,97.91,96.41,97.56,98.73)

Trang 20

5-2 16.1966667 12.4355155 19.957818 0.00000006-2 18.6266667 14.8655155 22.387818 0.00000007-2 19.4400000 15.6788488 23.201151 0.00000004-3 2.7033333 -1.0578178 6.464484 0.24683385-3 5.2866667 1.5255155 9.047818 0.00406686-3 7.7166667 3.9555155 11.477818 0.00009927-3 8.5300000 4.7688488 12.291151 0.00003255-4 2.5833333 -1.1778178 6.344484 0.28924146-4 5.0133333 1.2521822 8.774484 0.00636327-4 5.8266667 2.0655155 9.587818 0.00170296-5 2.4300000 -1.3311512 6.191151 0.35063927-5 3.2433333 -0.5178178 7.004484 0.11310167-6 0.8133333 -2.9478178 4.574484 0.9873690

2 Vẽ đồ thị

0 20 40 60 80 100 120

Trang 21

> A=matrix( ng, nrow=2,ncol=3, byrow=T, dimnames = list(c("tang 1.5 - 3","tang 0.5-1"), c("td1", "td2",

"td3")))

> chisq.test(A)

Pearson's Chi-squared test

data: A

X-squared = 249.9598, df = 2, p-value < 2.2e-16

Su tang can co lien quan den thuc don

KẾT LUẬN : do giá trị p-value = 2.2e-16 < 0.05 nên có

sự khác nhau giữa các thực đơn 1,2,3 và sự khác nhaunày có ý nghĩa thống kế,Ở mức ý nghĩa 5% Nhận thấy thực đơn 3 có sự tác động mạnh đến cân nặng nhất(367 người tăng 1.5- 3Kg/ tháng trên tổng số 415 người)nêntôi chọn thực đơn 3 để giúp bệnh nhân láy lại cân nặng ban đầu

BÀI 15:

>bai15<matrix(c(157,189,170,92,8,12,17,35,3,5,7,28),nrow=3,ncol=4,byrow=T,dimnames=list(c("cấu trúc

tốt","cấu trúc vừa","cấu trúc đạt"),c("pg a","pg

b","pg c","đối chứng")))

> chisq.test(bai15)

X-squared = 97.153, df = 6, p-value < 2.2e-16

> # P-value < 2.2e-16 nên có sự khác biệt về cấu trúcsản phẩm khi sử dụng các loại phụ gia khác nhau có mức ý nghĩa anpha = 5%

Trang 22

Ghi chú: ký tự a,b,c trên cùng 1 cột chỉ sự khác biệt

về hiệu suất thu hồi dịch chiết khi sử dụng các nồng

độ enzyme khác nhau

Trang 23

0 5 10 15 20 25 30 35

nhất(30.87% theo nồng độ khô)khi sử dụng enzyme ởnồng độ 0.3% và hàm lượng này theo thống kê không có

sự khác biệt khi sử dụng enzyme ở các nồng độ 0.2%,0.25%, 0.15% Tuy nhiên lại có sự khác biệt so vớikhi sử dụng ở các nồng độ 0.1%, 0.05% Vì vậy đểtrích ly polyphenol hiệu quả chúng tôi đề nghị chọnnồng độ enzyme là 0.15%

Phụ lục:

>

a<-c(0,0,0,0.05,0.05,0.05,0.1,0.1,0.1,0.15,0.15,0.15,0.2,0.2,0.2,0.25,0.25,0.25,0.3,0.3,0.3)

> a<- as.factor(a)

>

b<-c(20.3,21.5,23.6,24.5,25.1,27.2,27.4,27.9,28.3,28.5,2

Trang 24

Signif codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

> res<-aov(b~a)

> TukeyHSD(res)

diff lwr upr p adj0.05-0 3.80000000 0.4821762 7.117824 0.02041950.1-0 6.06666667 2.7488429 9.384490 0.00033590.15-0 7.63333333 4.3155096 10.951157 0.00002760.2-0 9.10000000 5.7821762 12.417824 0.00000350.25-0 8.96666667 5.6488429 12.284490 0.00000420.3-0 9.06666667 5.7488429 12.384490 0.0000037

Trang 25

0.1-0.05 2.26666667 -1.0511571 5.584490 0.29443580.15-0.05 3.83333333 0.5155096 7.151157 0.01918300.2-0.05 5.30000000 1.9821762 8.617824 0.00127730.25-0.05 5.16666667 1.8488429 8.484490 0.00162250.3-0.05 5.26666667 1.9488429 8.584490 0.00135570.15-0.1 1.56666667 -1.7511571 4.884490 0.67762100.2-0.1 3.03333333 -0.2844904 6.351157 0.08359790.25-0.1 2.90000000 -0.4178238 6.217824 0.10570660.3-0.1 3.00000000 -0.3178238 6.317824 0.08868750.2-0.15 1.46666667 -1.8511571 4.784490 0.73559280.25-0.15 1.33333333 -1.9844904 4.651157 0.80721630.3-0.15 1.43333333 -1.8844904 4.751157 0.75422560.25-0.2 -0.13333333 -3.4511571 3.184490 0.99999920.3-0.2 -0.03333333 -3.3511571 3.284490 1.00000000.3-0.25 0.10000000 -3.2178238 3.417824 0.9999999

Trang 26

Qua bảng trên tôi đề suất nên chọn loại đất A để

trồng cây, vì tỷ lệ cây tốt trên tổng số cây = 0.809

là tỷ lệ cao nhất trong ba loại đất khảo sát

PHỤ LỤC:

>bai17=matrix(c(170,40,180,50,150,60),nrow=2,ncol=3,byrow=TRUE

Trang 27

Nhận xét:

- Có sự khác nhau về hàm lương vitamin khi sử dụngcông suất siêu âm khác nhau ở mức ý nghĩa 5%

Trang 28

- Tôi chọn công suất 225 vì công suất này có sựkhác biệt nhât và có giá trị trung bình hàm lượngvitamin C lớn nhất.

PHỤ LỤC:

>vtmc=c(50.5,49.7,51.4,96.3,95.9,97.5,100.7,101.2,99.6,103.6,102.4,103.9,100.6,102.1,99.5,97.7,98.4,99.2)

Trang 29

Qua phép kiểm định anova ta thấy p-value= 0.0001333

< 0.05 nên có sự khác biệt về ý nghĩ thống kê giữacác nhóm ở mức ý nghĩa 5% Nhưng để đạt hệu quả caonhất và hiệu suất thu hồi dịch chiết cao nhất chúngtôi đề nghi sử dụng phương pháp kết hợp sóng siêu âm

và sử dụng enzyme

Trang 30

0 10 20 30 40 50 60 70 80 90 100

Trang 32

BÀI 22:

giá trị p-value = 0.02886 <0.05 thể hiện có sự khác

nhau về số lượng hàng chính phẩm trước và sau khithay đổi công nghệ ở mức tin cậy 95%.Số lượng phếphẩm sau khi thay đổi công nghệ giảm so với trước khiđổi công nghê.Nên công ty nên thay đổi công nghệ

PHỤ LỤC:

>mdat=matrix(c(38, 92,462,708),nrow=2,ncol=2,byrow=TRUE)

>chisq.test(mdat)

X-squared = 4.7757, df = 1, p-value = 0.02886

Trang 33

6 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8

Biểu đồ thể hiện mức độ yêu thích đối với các loại trà

Qua giá trị p-value=0.00212<0.05 ta thấy có sự khácbiệt về mức độ yêu thích của người thử đối với cácloại trà trên Với số điểm trung bình cao nhất (6.7-trà dứa) mà người thử đã cho thì ta thấy rằng sảnphẩm trà dứa được người tiêu dùng yêu thích nhất

PHỤ LỤC:

>group=c(rep(1,10),rep(2,10),rep(3,10))

Trang 34

>y=c(6.2,6.2,6.5,6.2,6.4,6.5,6.5,6.2,5.8,6.2,6.6,6.3,6.7,6.6,6.7,7.0,6.5,6.9,6.4,6.9,6.4,6.4,6.5,6.0,6.6, 6.4,6.5,6.1,6.3,6.8)

Trang 35

Giá trị pvalue= 4.95e-05 < 0.05 nên có sự khác biệt

giữa A và B có ý nghĩa thống kê ở mức anpha = 5% Dựavào mean of X (giá trị trung bình của A) và mean of Y(giá trị trung bình của B)ta thấy giá trị trung bình của giống B lớn hơn giống A nên khả năng của cho sữa của giống B tốt Nên tôi chọn giống B

PHỤ LỤC:

>B=c(rep(205,7),rep(215,9),rep(225,8),rep(235,8),rep(245,14),rep(255,11),rep(265,6),rep(275,5))

>A=c(rep(205,14),rep(215,21),rep(225,20),rep(235,13),rep(245,5),rep(255,4),rep(265,3),rep(275,2))

[58] 265 265 265 265 265 265 275 275 275 275 275

> var.test(A,B)

# pvalue=0.1219>0.05 nên sự khác biệt về phương sai

giữa A và B không có ý nghĩa Ta sử dụng T.test cùng phương sai

>t.test(A,B,var.equal=T)

Trang 36

Bảng : Giá trị tỉ lệ nảy mầm giữa các giống

Ta thấy p-value = 5.46e-12 < 0.05 nên có sự khác

nhau về ý nghĩa thống kế giữa các giống lúa Ở mức ý nghĩa anpha = 5% mà theo bảng ta thấy tỉ lệ của đại mạch cao nhất nên ta chọn giống C để sản xuất malt

Trang 37

BÀI 27:

Chú thích: các kí tự a,b,c trên cùng 1 cột để thể hiện sựkhác biệt năng suất giữa các giống ngô lai khác nhau.Qua giá trị p-value=0.001352<0.05 ta thấy các giống ngô có năng suất khác biệt có ý nghĩa thống kê ở mức anpha=5% Năng suất giống ngô 2,4 thì không có sự khác biệt nhưng giống ngô 1,3 thì lại có năng suất khác biệt để đạt hiệu quả và năng suất cao thì chúngtôi khuyên nông dân nên canh tác giống ngô 1

0 1 2 3 4 5 6

giống ngô lai

Trang 38

PHỤ LỤC:

>giong=c(4.5,4.6,4.7,4.6,4.4,3.8,4.2,3.8,3.9,4.1,4.4,6.3,4.5,5.3,5.9,3.5,4.2,4.3,4.2,3.2)

>group=c(rep("giong1",5),rep("giong2",5),rep("giong3”,5),rep("giong4",5))

Trang 39

giong4-giong3 -1.40 -2.3024692 -0.4975308 0.0021023

BÀI 28:

Phương trình đường chuẩn y= 0.1851 x +0.007

Hàm lượng ppm có trong 2 mẩu nước lần lượt là0.00339(ppm) , 0.00337(ppm)

Trang 41

Signif codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’0.1 ‘ ’ 1

Residual standard error: 0.0128 on 3 degrees offreedom

Multiple R-squared: 0.9993, Adjusted R-squared:0.9991

F-statistic: 4532 on 1 and 3 DF, p-value: 7.223e-06Phương trình hồi quy y=6.81x

Tìm nồng độ mẫu 2: 0.883 = 6.81 x

X = 0.1297

Áp dụng công thức pha loãng: 0.1297.10 = x.1

Nồng độ đường của mẫu 2 trong 100ml mẫu là 1.297 g/lKhối lượng đường có trong 100ml mẫu: 1.297 x 0.1 =0.1297g

Hàm lượng là 1.297%

Khối lượng chất khô trong 10g là 10.15%=1.5

Hàm lượng dg trong 1.5g chất khô: 0.1297/1.5

Trang 42

BÀI 31:

1 Dùng kiểm định ANOVA 1 yếu tố

- do giá trị p –value=0.2552>0.05 ta thấy Khả năngphát triển của rau câu không khác biệt khi ánh sángkhác nhau ở mức ý nghiã 5%

- Nếu bỏ qua nhiệt độ thì tôi sẽ nuôi trồng rau câu ởchế độ ánh sáng A2 vì rau câu phát triển tốt hơn do

có lượng tăng khối lượng cao hơn A1 (11.15 > 8.30)

PHỤ LỤC:

> group<-c(rep(1,6),rep(2,6))

Trang 43

p-PHỤ LỤC:

> a= gl(2,6,12)

Trang 44

> b= gl(6,2,12)

>pt=c(12.5,12.7,8.3,8.5,3.8,4.0,15.5,15.7,11.5,12.0,6.0,6.2)

Signif codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’0.1 ‘ ’ 1

> res=aov(a~group)

> TukeyHSD(res)

Trang 45

diff lwr upr p adj

Trang 47

Qua phép kiểm định anova ta thấy p-value của đất

=0.5985 > 0.05,p-value của giống=0.2096 > 0.05 nên không có sự sai khác về ý ngĩa thống kê ở mức

anpha=5% giữa các nhóm nên chọn nhóm nào cũng được

PHỤ LỤC:

>dat=gl(5,4,20)

Định dạng
Số trang	54
Dung lượng	174,44 KB

34 Bài tập xử lý số liệu trên phần mềm R

Sử dụng ANOVA 2 yếu tố