Cho ví dụ Một số hạn chế của thống kê là: - Thống kê luôn có sự sai số nhất định - Các kết luận của thống kê suy diễn không thể kết luận chính xác 100% thực tế - Khó giải thích cho ngườ
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG LÂM TP HỒ CHÍ MINH KHOA CÔNG NGHỆ HÓA HỌC VÀ THỰC PHẨM
Trang 2đề, giải pháp và đối tượng cần phân tích
Ví dụ: bạn An sử dụng dữ liệu phỏng vấn 10 bạn để xác định số tiền ăn sáng của các bạn sinh viên Nông Lâm rồi dựa vào nó để đưa ra mức giá phù hợp cho menu của quán, đây là 1 dạng thống kê ứng dụng
3/ Những hạn chế của thống kê là gì? Cho ví dụ
Một số hạn chế của thống kê là:
- Thống kê luôn có sự sai số nhất định
- Các kết luận của thống kê suy diễn không thể kết luận chính xác 100% thực tế
- Khó giải thích cho người không có chuyên môn về việc tại sao lại có được kết luận đã đưa ra
Ví dụ: số bạn ăn sáng với số tiền từ 0 – 10 ngàn theo thống kê của An là 13/100, tức 13% Điều này không nói lên được rằng trong toàn bộ sinh viên Nông Lâm,
có 13% bạn ăn sáng với số tiền từ 0 – 10 ngàn
4/ Thống kê mô tả là gì? Cho ví dụ
Thống kê mô tả là thống kê miêu tả các thuộc tính, tính chất của mẫu hoặc đám đông
Ví dụ: các dữ liệu về x trung bình, độ lệch chuẩn đều là kết quả của thống kê
mô tả
5/ Thống kê suy diễn là gì? Cho ví dụ
Trang 3Thống kê suy diễn là thống kê sử dụng các dữ liệu từ thống kê mô tả để kiểm định hoặc giải thích, đưa ra 1 kết luận nào đó
6/ Mẫu là gì? Cho ví dụ
Mẫu là một nhóm nhỏ của đám đông, được xác định bằng cách chọn một cách ngẫu nhiên hoặc không ngẫu nhiên từ đám đông
Ví dụ: 100 bạn được chọn một cách ngẫu nhiên được xem là mẫu
7/ Dân số/ đám đông là gì? Cho ví dụ
Dân số/ đám đông trong thống kê ứng dụng là một nhóm đối tượng có một đặc điểm chung nào đó, thứ đang cần được thống kê
Ví dụ: 6000 bạn học sinh trường Đại học Nông Lâm là đám đông
8/ Các loại điều tra nghiên cứu thực phẩm là gì? Cho ví dụ
Một số loại nghiên cứu thực phẩm là:
- Nghiên cứu thực nghiệm
- Nghiên cứu phân tích
- Nghiên cứu tương quan
- Nghiên cứu lý thuyết
Ví dụ: bạn An khảo sát để đưa ra kết luận, đây là dạng nghiên cứu thực nghiệm
9/ Biến là gì? Cho ví dụ
Biến là một kí hiệu đại diện cho 1 đối tượng toán học
Ví dụ: biến x trong khảo sát trên là số tiền mà 1 bạn được phỏng vấn bỏ ra cho bữa sáng của mình
10/ Xác suất là gì? Cho ví dụ
Xác suất là tỉ lệ để một việc gì đó có thể xảy ra
Ví dụ: nếu chọn ngẫu nhiên 1 bạn trong số 100 bạn phỏng vấn, xác suất để chọn được bạn tiêu 0 – 10 ngàn cho bữa sáng là 13/100, tức là 13%
Trang 4Ta có CV lớn hơn môt điều này chỉ ra rằng độ lệch chuẫn lớn hơn trung bình từ
đó ta thấy được rằng dữ liệu dao động rất mạnh chênh lệch giữa các dữ liệu lớn dẫn đến độ lệch chuẫn cao, S>0 sờ đồ sẽ lệch hoàn toàn về bên phải
Trang 6Chương 3
Quy trình sản xuất cà phê hòa tan
Cà phê nhân
Làm sạch Rang Xay Trích ly
Xử lý dịch chiết
Cô đặc bốc hơi
Sấy phun Phối trộn Bao gói
Trang 795.0% confidence interval for the difference between the means
assuming equal variances: -2.6 +/- 1.66798 [-4.26798, -0.932024]
t test to compare means
Trang 8Null hypothesis: mean1 = mean2
Alt hypothesis: mean1 NE mean2
assuming equal variances: t = -3.39629 P-value = 0.00530599
Reject the null hypothesis for alpha = 0.05
Trang 995.0% confidence interval for the difference between the means
assuming equal variances: 0.27 +/- 0.435024 [-0.165024, 0.705024]
t test to compare means
Null hypothesis: mean1 = mean2
Trang 10Alt hypothesis: mean1 NE mean2
assuming equal variances: t = 1.38291 P-value = 0.19679
Do not reject the null hypothesis for alpha = 0.05
3/
4/
5/
Ta có giá trị P lớn hơn 0.05 nên A và B có sự khác biệt không có ý nghĩa thống
kê nên chọn nguồn A hay B đều được
Trang 1195.0% confidence interval for the difference between the means
assuming equal variances: -0.355714 +/- 1.84752 [-2.20323, 1.4918]
t test to compare means
Null hypothesis: mean1 = mean2
Alt hypothesis: mean1 NE mean2
assuming equal variances: t = -0.419502 P-value = 0.682262
Do not reject the null hypothesis for alpha = 0.05
3/
Trang 1395.0% confidence interval for the difference between the means
assuming equal variances: -9.42857 +/- 7.8435 [-17.2721, -1.58507]
t test to compare means
Null hypothesis: mean1 = mean2
Alt hypothesis: mean1 NE mean2
assuming equal variances: t = -2.61913 P-value = 0.0224209
Reject the null hypothesis for alpha = 0.05
3/
Trang 1710/
Ta sẽ chọn kích cỡ A vì sau các quá trình kiểm tra độ tin cậy của thí nghiệm thì kích thước A có định mức thấp nhất và có sự khác biệt so với B và C mức độ tin cậy là 95%
Trang 18Summary Statistics for VITAMINC
Trang 19Vì các số liệu khác biệt không có ý nghĩa thống kê chỉ có khoảng 15 và
30 là khác biệt mà khoảng thời gian 15 cao hơn đồng thời gia nhiệt trong thời gian 15(minutes) sẽ tiết kiệm nhiều thời gian hơn nên ta chọn thời gian xử lý nhiệt (treatment time) là 15(minutes)
Bài 3:
1/
15 20 25 30 35 Means and 95.0 Percent LSD Intervals
TREATMENTTIME 20
Trang 20Yếu tố thí nghiệm: phụ gia và vị trí đo
Trang 2310/
Ta sẽ chọn sử dụng chất phụ gia D ở vị trí đo 4, do khi sử dụng D sản phẩm có
độ cứng cao hơn so với các chất phụ gia khác
Trang 2710/
Ta nên chọn tỷ lệ phụ gia là 4% vì ở tỷ lệ này dù đo ở vị trí nào thì t cũng thu được độ chắc cao hơn so với các nhóm tỷ lệ còn lại, nhưng cao nhất là khi đo ở vị trí 4
Trang 3110/
Do các giá trị đều giao nhau khác biệt không có ý nghĩa thống kê nên
ta chọn nhiệt độ nào cũng được do đó ta sẽ sử dụng nhiệt độ 600C để tiết kiệm chi phí cũng như thời gian gia nhiệt
TEMPERATURE 7
Trang 35Bài 7:
Means and 95.0 Percent LSD Intervals
OBSERVUTIONS 590
POWER 530
Trang 36Yếu tố thí nghiệm: số tuần, loại bò, loại thức ăn
Trang 38Multiple Range Tests for MILK by COW
Trang 4010/
− Ta thấy chỉ có loại bò 1 là cho lượng sữa cao nhất và loại
bò 1-4 thì có sự khác biệt không có ý nghĩa thống kê nên
ta sẽ chọn loại bò 1
− Ta thấy chỉ có loại thực phẩm D là cho lượng sữa cao nhất và loại thực phẩm C-D thì có sự khác biệt không có ý nghĩa thống kê nên ta sẽ chọn loại thực phẩm D
− Ta thấy tuần 2 là cho lượng sữa cao nhất và tuần 2-4,2-3 thì
có sự khác biệt không có ý nghĩa thống kê nên ta sẽ thực hiện trong tuần 2
Means and 95.0 Percent LSD Intervals
FOOD 19
Trang 440.5 1 1.5 Means and 95.0 Percent LSD Intervals
CONCENTRATE 9
Trang 4510/
Dựa vào bảng ANOVA ta thấy được Ti le và Nongdo có ảnh hưởng đến lượng alginate thu được, tuy nhiên 2 yếu tố này không tương tác với nhau Dựa vào biểu dồ tương tác ta lại thấy để thu được lượng alginate lớn nhất ta nên chọn Nongdo 1% Na2CO3 và Ti le C (1:40) Tuy nhiên
Ti le B (1:30) và C (1:40) khác biệt không có ý nghĩa thống kê ở độ tin cậy 95% ( trắc nghiệm LSD) Vậy ta sẽ chọn Concentrate 1% Na2CO3
và Ratio B để tiến hành thu alginate từ rong biển để tiết kiệm nguyên liệu
1 1.5
Trang 4910/
− Dựa vào bảng ANOVA, ở độ tin cậy 95%, nồng độ boric acid
và citric acid có ảnh hưởng đến tỷ lệ biến đen của tôm, và 2 yếu tố này có tương tác với nhau
Means and 95.0 Percent LSD Intervals
CITRICACID 11
Interaction Plot
CITRICACID 8
Trang 505% và citic acid 5% tỷ lệ biến đen của đầu tôm là nhỏ nhất→
để hạn chế tỷ lệ biến đen của tôm ta nên xử lý tôm ở nồng độ
boric acid 5% và citric acid 5%
Trang 530.5 1 1.5 Means and 95.0 Percent LSD Intervals
SUGAR 8
Trang 5410/
− Dựa vào bảng ANOVA ta thấy được tỷ lệ muối và đường có ảnh hưởng đến giá trị cảm quan của sản phẩm, tuy nhiên 2 yếu
tố này không tương tác với nhau
− Dựa vào biểu dồ tương tác ta lại thấy để đạt được giá trị cảm quan tốt nhất ta nên chọn tỷ lệ đường 1% và tỷ lệ muối 3% Tuy nhiên tỷ lệ đường 2% và 4% khác biệt không có ý nghĩa thống
kê ở độ tin cậy 95% ( trắc nghiệm LSD) Vậy ta sẽ chọn tỷ lệ đường 1% và tỷ lệ muối 2% để sản phẩm đạt giá trị cảm quan tốt nhất mà vẫn tiết kiệm được muối
Trang 563 18 49.5 18.8094 37.9988% 18.0 80.0 62.0 -0.3074 Total 54 44.833
Trang 601 2 3 Means and 95.0 Percent LSD Intervals
RATION 40
MONTH 0
Trang 61Interaction Plot
MONTH 0
Trang 62Kết quả thí nghiệm: tỉ lệ đốm đen của tôm
Trang 661 2 3 Means and 95.0 Percent LSD Intervals
CROP 13
Trang 6710/
− Dựa vào bảng ANOVA ta biết được nồng độ A và hoạt lực B có ảnh hưởng đến tỷ lệ biến đen của tôm, còn vụ tôm thì không
Interaction Plot
CONCENTRATE 8
Interaction Plot
CROP 10
Interaction Plot
CROP 8
3 5
Trang 68độ A càng cao thì tỷ lệ biến đen của tôm càng thấp, hoạt lực B ở mức 3% và 5% thì tỷ lệ biến đen của tôm thấp Do
đó để bảo quản tôm tốt nhất và tiết kiệm nguyên liệu chúng ta nên chọn nồng độ A ở 5% và hoạt lực B ở 3%
Summary Statistics for QUALITY
CROP Count Average Standard
Trang 731 2 3 Means and 95.0 Percent LSD Intervals
VARIETY 33
Interaction Plot
VARIETY 0
Trang 7410/
− Dựa vào bảng ANOVA ta biết được giống và tỷ lệ
enzyme, vụ cá có ảnh hưởng đến điểm vị của sản phẩm
− Thông qua trắc nghiệm LSD ở độ tin cậy 95% ta thấy được 3 yếu tố trên điều khác biệt có ý nghĩa thống kê, riêng yếu tố vụ cá là yếu tố khối nên khối nên ta không thể thay đổi được.Từ đó ta sẽ chọn các điểm cao nhất của 2 yếu tố là tỷ lệ enzyme và giống là tỷ lệ enzyme 3% và giống 1
2 3
Trang 768/
Trang 77Multiple Range Tests for QUALITY by AADDITIVITYRATIO
Trang 790 10 20 Means and 95.0 Percent LSD Intervals
BADDITIVITYRATIO 3
2.5 3
Trang 802.5 3
Interaction Plot
BADDITIVITYRATIO 3
2 3
Trang 851 2 3 4 Means and 95.0 Percent LSD Intervals
MIXINGMACHINE 10
Trang 8610/
Do các yếu tố không ảnh hưởng đến chất lượng sản phẩm và khác biệt không có ý nghĩa thống kê nên ta chọn như thế nào cũng được
Interaction Plot
SALT 11
2 3 4
Interaction Plot
SUGAR 12
2 3 4
Interaction Plot
SUGAR 11
Trang 87Chương 7:
Bài 1
1/
Biến phụ thuộc: trọng lượng
Biến không phụ thuộc: thời gian
Trang 88Biến phụ thuộc: trọng lượng
Biến không phụ thuộc: nhiệt độ
2/
Kết quả thí nghiệm: trọng lượng sản phẩm sấy khô
3/
Các yếu tố khác: quy trình thực hiện, người thực hiện, cân, dụng cụ
Plot of Fitted Model WEIGH = 24.2308 - 1.52747*TIME
TIME 0
Trang 90Bài 3:
1/
Biến phụ thuộc: trọng lượng
Biến không phụ thuộc: thời gian
Analysis of Variance
Trang 91Biến phụ thuộc: trọng lượng
Plot of Fitted Model WEIGH = 1.63543 + 0.282234*TIME
TIME 1.8
Trang 92Biến không phụ thuộc: thời gian, nhiệt độ
Trang 93Biến phụ thuộc: độ nhớt của sản phẩm
Biến không phụ thuộc: nồng độ dung dịch
Plot of WEIGHT
65 75 85 95 105
predicted 65
6061
6263
6465TEMPERATURE 69
Trang 94Kết quả thí nghiệm: độ nhớt của sản phẩm
Trang 95Plot of Fitted Model VISCOSITYOFPRODUCT = -177.679 + 76.9286*CONCENTRATIONOFSOLUTION
CONCENTRATIONOFSOLUTION 0
Trang 96R-squared (adjusted for d.f.) = 93.9153 percent
Standard Error of Est = 0.865297
Mean absolute error = 0.519282
Durbin-Watson statistic = 1.73566 (P=0.3499)
Lag 1 residual autocorrelation = -0.005377
Regression coeffs for MOISTURE
Trang 97This pane displays the regression equation which has been fitted to the data The equation of the fitted model is
MOISTURE = 199.567 - 0.51525*TEMPERATURE - 776.74*WINDSPEED - 0.0916522*TIME + 1501.28*WINDSPEED^2 + 0.000110323*TIME^2
Trang 98R-squared (adjusted for d.f.) = 78.7536 percent
Standard Error of Est = 1.25335
Mean absolute error = 0.843167
Durbin-Watson statistic = 1.68517 (P=0.2566)
Lag 1 residual autocorrelation = 0.10325
Regression coeffs for WHITENESS
Trang 101TIME 0
Trang 102TIME 0
Trang 103TIME 0
Trang 104R-squared (adjusted for d.f.) = 93.374 percent
Standard Error of Est = 0.373241
Mean absolute error = 0.218795
TIME 0
Trang 105Lag 1 residual autocorrelation = 0.0975052
Regression coeffs for SALTY
Trang 106TIME 30.0 90.0 89.999
1 BRINESOLU
MATERIAL 1.5 2.5 1.5033
1 Goal: minimize SALTY
Trang 1078 9
10 1112 BRINESOLUTION 0
Trang 108(corr.) 0.024436 14
R-squared = 96.3507 percent
R-squared (adjusted for d.f.) = 91.4849 percent
Estimated Response Surface MATERIAL=2.0
30 40 50
60 70 80
90 TIME
8 9
10 1112 BRINESOLUTION 0
Trang 109Standard Error of Est = 0.0121912
Mean absolute error = 0.00606667
Durbin-Watson statistic = 1.92767 (P=0.4778)
Lag 1 residual autocorrelation = 0.0102327
Regression coeffs for MIXINGPROCESS
Coefficient Estimat
e
constant 2.6878
7 A:SORBIT
Trang 1111.51.71.92.12.32.5GLYCEROL 0
Trang 112R-squared (adjusted for d.f.) = 91.2795 percent
Standard Error of Est = 0.600179
Mean absolute error = 0.349556
Durbin-Watson statistic = 1.73409 (P=0.1277)
Lag 1 residual autocorrelation = 0.129068
Regression coeffs for PRODUCTIVITY
1.51.71.92.12.32.5GLYCEROL 0
Trang 114170180
190200210 TIME 0
Trang 115Factor Low High Optimu
R-squared (adjusted for d.f.) = 67.2203 percent
Estimated Response Surface
65 67 69
71 73 75TEMPERATURE
150160
170180
190200210 TIME 0
Trang 116Mean absolute error = 0.903619
Durbin-Watson statistic = 2.56403 (P=0.8334)
Lag 1 residual autocorrelation = -0.290037
Regression coeffs for PRODUCTIVITY
3 Goal: minimize PRODUCTIVITY
Trang 117R-squared (adjusted for d.f.) = 72.9104 percent
Standard Error of Est = 2.2169
Mean absolute error = 1.60044
Durbin-Watson statistic = 2.04933 (P=0.3978)
Lag 1 residual autocorrelation = -0.0553582
Regression coeffs for SALT
Trang 1208387
9195TEMPERATURE 0
7579
8387
9195TEMPERATURE 0
Trang 1218387
9195TEMPERATURE 0
Trang 122R-squared (adjusted for d.f.) = 17.4824 percent
Standard Error of Est = 279.215
Mean absolute error = 135.082
Durbin-Watson statistic = 1.369 (P=0.1103)
Lag 1 residual autocorrelation = 0.294644
Estimated Response Surface TIME=60.0
2 2.4 2.8
3.2 3.6 4WATER
7579
8387
9195TEMPERATURE 0
Trang 123Regression coeffs for DISSOLVE
te
7 A:TEMPERAT
7 B:DENSITY -
Trang 124Factor Low High Optimu
Analysis of Variance for WHITENESS
R-squared (adjusted for d.f.) = 72.3171 percent
Standard Error of Est = 0.582459
Mean absolute error = 0.24779
Durbin-Watson statistic = 1.9375 (P=0.4386)
Lag 1 residual autocorrelation = 0.0309002
Regression coeffs for WHITENESS
Trang 126Main Effects Plot for WHITENESS
Estimated Response Surface
75 77 79
81 83 85TEMPERATURE
0.340.360.380.40.420.440.46 DENSITY 0
Trang 1270.340.360.380.40.420.440.46 DENSITY 0
Trang 1280.340.360.380.40.420.440.46DENSITY 0
Trang 129Estimated Response Surface
75 77 79
81 83 85TEMPERATURE
0.340.360.380.40.420.440.46 DENSITY 0
Trang 132Ta có biểu đồ phân phối
Trang 133Độ lệch chuẩn (standard deviation) σ = 0.21
• Sản phẩm B:
Giá trị trung bình (mean) μ = 1.05
Độ lệch chuẩn (standard deviation) σ = 0.23
• Hàm phân phối xác suất
F (x=4.7) = 0.1 × √2𝜋1 exp [−( 4.7− 7.2)2 × 0.122] = 0%
Trang 134Với độ tin cậy 95%, ta có 𝑡𝑡 = 1.68
Vì |𝑡𝑐| > 𝑡𝑡 nên nhận 𝐻0, 2 số trung bình khác nhau không có ý nghĩa thống kê
Trang 135Vì F > 0.05 nên bác bỏ 𝐻0, giá trị hao hụt khối lượng thực sự trong thực tế của từng phương pháp xử trong 5, 10, 15, 20, 25 phút khác biệt có ý nghĩa thống kê
Với độ tin cậy 95%, ta có 𝑡𝑡 = 1.686
Vì |𝑡𝑐| > 𝑡𝑡 nên nhận 𝐻0, nồng độ kháng khuẩn của nước trước và sau miễn dịch không có ý nghĩa thống kê