Điều đó chứng tỏ các giá trị của mẫu có xử lý nhiệt có độ tincậy cao.Kết luận của thí nghiệm: Vì sự khác biệt giữa 2 quy trình không có ý nghĩa thống kênên ta có thể chọn quy trình không
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỐ HỒ CHÍ MINH
KHOA CÔNG NGHỆ HÓA HỌC VÀ THỰC PHẨM
Môn học: Thống kê ứng dụng và phương pháp thí nghiệm
Giảng viên: Nguyễn Anh Trinh
Sinh viên: Trần Thị Hồng Thắm
MSSV: 21125906
Lớp: DH21BQC
TP.HCM, ngày 27 tháng 11 năm 2023
Trang 2CHƯƠNG 1: GIỚI THIỆU VỀ THỐNG KÊ ỨNG DỤNG
1 What is statistics? For example
Thống kê là một nhánh của toán học ứng dụng liên quan đến việc thu thập, mô tả, phântích và suy luận của Fstica về kết luận từ dữ liệu định lượng
VD: Trong một cuộc khảo sát gần đây với người Mỹ, 52% đảng viên Đảng Cộng hòacho rằng hiện tượng nóng lên toàn cầu đang diễn ra
2 What is applied statistics? For example
Thống kê ứng dụng bao gồm lập kế hoạch thu thập dữ liệu, quản lý dữ liệu, phân tích,diễn giải và rút ra kết luận từ dữ liệu cũng như xác định các vấn đề, giải pháp và cơ hộibằng cách sử dụng phân tích
3 What are the limitations of statistics? For example
- Thống kê không xử lý các phép đo riêng lẻ
- Thống kê chỉ đề cập đến các đặc điểm định lượng
- Kết quả thống kê chỉ đúng ở mức trung bình
- Thống kê chỉ là một trong những phương pháp nghiên cứu một vấn đề
- Số liệu thống kê có thể bị lạm dụng
4 What is the descriptive statistics? For example
Thống kê mô tả được sử dụng để mô tả những đặc tính cơ bản của dữ liệu thu thậpđược từ nghiên cứu thực nghiệm qua các cách thức khác nhau
5 What is the inferential statistics? For example
Thống kê suy luận là sử dụng các thuộc tính đó để kiểm tra các giả thuyết và đưa ra kếtluận
6 What is sample? For example
Mẫu là sự lựa chọn ngẫu nhiên các thành viên của một quần thể và là một nhóm nhỏhơn được rút ra từ quần thể la có các đặc điểm của toàn bộ quần thể
7 What is population? For example
Trong thống kê, dân số là mẫu đại diện của một nhóm người/vật lớn hơn có một hoặcnhiều đặc điểm chung
Trang 3+ Nghiên cứu định lượng
Kiểm tra giả thuyết
Cỡ mẫu nhỏ hơn Tóm tắt, phân loại, giải thíchVD:
9 What is variable? For example
Biến là một đại lượng có giá trị bất kỳ, không bắt buộc phải duy nhất có một giá trị(không có giá trị nhất định) Biến số là số có thể thay đổi giá trị trong một tình huống
có thể thay đổi
10 What is probability? For example
Xác suất là một nhánh của toán học liên quan đến các mô tả bằng số về khả năng xảy
ra một sự kiện, hoặc khả năng một mệnh đề là đúng
Trang 4CHƯƠNG 2: THỐNG KÊ MÔ TẢ 2.1 Chi phí sản phẩm cho 29 lần quan sát như sau:
Hệ số độ lệch S = 2,83 lớn hơn 0 => (mode < mean) phân bố lệch về phía bên phải
2.2 Cho tập hợp quan sát X={3;5;6;7;?} Tính trung bình số học, độ lệch chuẩn, trung vị.
Trang 52.5 Viết ra danh sách 1? số thỏa mãn cả hai điều kiện sau:
(a) số trung vị < số trung bình số học
Trang 6 Số trung vị = 3,5
Số mode = 2
(a) 3,5 < 3,75 => Số trung vị < Số trung bình số học => Thỏa yêu cầu đề bài.(b) 2 < 3,5 => Số mode < Số trung vị => Thỏa yêu cầu đề bài
Trang 7CHƯƠNG 3: THIẾT KẾ THÍ NGHIỆM 3.1 Nghiên cứu quá trình phát triển sản phẩm ngũ cốc.
Plastic tráng nhôm Thùng carton
Ruốc thịt Các chất
dinh dưỡng
Trang 83.2 Nghiên cứu quá trình bảo quản thịt.
Sơ chế
Pha cắt nguyên liệu (thái, cắt định hình)
Chế biến (kho, hầm, luộc)
Đóng gói
Bảo quản lạnh
Sản phẩm
Nguyên liệu
Kiểm tra nguyên liệu
Làm sạch
Trang 9CHƯƠNG 4: THIẾT KẾ HAI MẪU 4.1 Kết quả thí nghiệm độ Brix của nước xoài được chế biến từ 2 giống xoài A và B
So sánh trung bình hai mẫu A và B
- Ở độ tin cậy 95%, mẫu A có giá trị trung bình là 16.9571 +/- 1.4455
- Ở độ tin cậy 95%, mẫu B có giá trị trung bình là 19.5714 +/- 1.19124
=> Từ đó, ta thấy giá trị trung bình của mẫu B lớn hơn mẫu A
- Kiểm định T cho biết giá trị t = -3.41515 và giá trị P = 0.0051243; cả giá trị t và giátrị P đều nhỏ hơn 0,05
=> Hai giá trị trung bình của mẫu A và mẫu B là khác biệt có ý nghĩa thống kê
Trang 10Biểu đồ tần số
Nhận xét: Biểu đồ phân bố tần suất cho biết số lần xuất hiện của các giá trị Theo đó:
2 1 0 1 2 3
Trang 11Nhận xét: Mẫu xoài B có các giá trị tập trung lại hơn so với mẫu xoài A, ít phân tán
hơn Điều đó chứng tỏ các giá trị của mẫu xoài B có độ tin cậy cao
Kết luận của thí nghiệm:
Vì sự khác biệt giữa 2 giống xoài có ý nghĩa thống kê nên chọn giống xoài B vì có giátrị trung bình của độ Brix cao
4.2 Kết quả thí nghiệm độ Ph của nước được thăm dò từ nguồn A và B:
So sánh trung bình hai mẫu A và B
- Ở độ tin cậy 95%, mẫu A có giá trị trung bình là 6,72167 +/- 0,141018
- Ở độ tin cậy 95%, mẫu B có giá trị trung bình là 6,45333 +/- 0,483046
- Kiểm định T cho biết giá trị t = 1,37075 và giá trị P = 0.200432; cả giá trị t và giá trị Pđều lớn hơn 0,05
Trang 12=> Hai giá trị trung bình của mẫu A và mẫu B là khác biệt không có ý nghĩa thống kê.
Biểu đồ tần số
Nhận xét: Biểu đồ phân bố tần suất cho biết số lần xuất hiện của các giá trị Theo đó:
Biểu đồ hộp
A
B 4
2 0 2 4
Trang 13Nhận xét: Mẫu nước của nguồn B có các giá trị phân tán hơn so với mẫu nước từ
nguồn A Điều đó chứng tỏ các giá trị của mẫu nước từ nguồn A có độ tin cậy cao
Kết luận của thí nghiệm: Vì sự khác biệt giữa 2 mẫu nước không có ý nghĩa thống kê
nên ta có thể chọn mẫu A hoặc mẫu B đều như nhau
4.3 Vi sinh vật (cfu/g) của sản phẩm được xử lý ở 2 quy trình không có nhiệt và có nhiệt.
Repeat KHONG CONHIET CONHIET
So sánh trung bình hai mẫu KHONGCONHIET và CONHIET
- Ở độ tin cậy 95%, mẫu KHONGCONHIET có giá trị trung bình 3,27143 +/- 1,64467[1,62675, 4,9161]
Trang 14- Ở độ tin cậy 95%, mẫu CONHIET có giá trị trung bình là 2,91714 +/- 1,26678[1,65036, 4,18392]
KHONGCONHIET
CONHIET 4
2 0 2 4
Trang 15Biểu đồ hộp
Nhận xét: Mẫu có xử lý nhiệt có các giá trị tập trung lại hơn so với mẫu không xử lý
nhiệt A, ít phân tán hơn Điều đó chứng tỏ các giá trị của mẫu có xử lý nhiệt có độ tincậy cao
Kết luận của thí nghiệm: Vì sự khác biệt giữa 2 quy trình không có ý nghĩa thống kê
nên ta có thể chọn quy trình không có nhiệt hoặc quy trình có nhiệt đều như nhau
Box-and-Whisker Plot
KHONGCONHIET
CONHIET
Trang 164.4 Glycogen (mg/g) của sản phẩm được xử lý ở 2 quá trình là Oven và Microwave:
So sánh trung bình hai mẫu OVEN VÀ MICROWARE
- Ở độ tin cậy 95%, mẫu OVEN có giá trị trung bình là 25,2857 +/- 5,41159
- Ở độ tin cậy 95%, mẫu MICROWARE có giá trị trung bình là 16,0 +/- 7,14392
Từ đó, ta thấy giá trị trung bình của mẫu OVEN lớn hơn mẫu MICROWARE
- Kiểm định T cho biết giá trị t = 2,53525 và giá trị P = 0,0261658; cả giá trị t và giá trị
P đều nhỏ hơn 0,05
Trang 17=> Hai giá trị trung bình của mẫu OVEN và mẫu MICROWARE là khác biệt có ýnghĩa thống kê
Biểu đồ tần số
Nhận xét: Biểu đồ phân bố tần suất cho biết số lần xuất hiện của các giá trị Theo đó:
- Oven:
0-10: Không có giá trị xuất hiện
10-20: có 1 giá trị xuất hiện
20-30: có 5 giá trị xuất hiện
30-40: có 1 giá trị xuất hiện
- Microware:
0-10: Có 2 giá trị xuất hiện
10-20: có 2 giá trị xuất hiện
20-30: có 3 giá trị xuất hiện
30-40: không có giá trị xuất hiện
OVEN
MICROWARE 5
3 1 1 3 5
Trang 18Biểu đồ hộp
Nhận xét: Mẫu được xử lý ở Microware có các giá trị phân tán hơn mẫu được xử lý ở
Oven; giá trị trung bình nằm xa so với trung vị
Kết luận của thí nghiệm:Vì sự khác biệt giữa 2 quá trình xử lý có ý nghĩa thống kê
Trang 19CHƯƠNG 5: THIẾT KẾ NGHIÊN CỨU KHÁC NHAU 5.1 Định mức sản xuất sản phẩm chế biến từ ba kích cỡ cá:
4 Mỗi nghiệm thức lặp lại 3 lần, có 9 đơn vị thí nghiệm
5 Cần sử dụng 1 loại cá duy nhất, độ tươi như nhau, tay nghề người công nhân là như
nhau, sử dụng 1 chiếc cân duy nhất, thực hiện trên cùng 1 dụng cụ (dao, kéo,…)
6 Xác định thông số thống kê:
KICHCOC
A Count Average
Standard deviation
Coeff of variation
Minimu m
Maximu
Stnd skewness
- Có 9 đơn vị nghiệm thức cho 3 nghiệm thức
- Độ lệch chuẩn của kích cỡ B là nhỏ nhất, cho thấy các giá trị của kích cỡ B có mức
độ phân tán thấp
Trang 207 Phân tích phương sai ANOVA:
Nhận xét:
Giá trị P = 0,0120 của kiểm định F nhỏ hơn 0,05 nên sự khác biệt là có ý nghĩa thống
kê giữa các giá trị trung bình của định mức sơ chế trong các kích cỡ cá ở độ tin cậy95%
Trang 219 Biểu đồ mean plot.
10 Kết luận của thí nghiệm:
- Dựa vào các tính toán và biểu đồ trên ta chọn kích cỡ cá A vì kích cỡ cá A có địnhmức thấp nhất và bằng 1,54 và có sự khác biệt so với B và C mức độ tin cậy
Means and 95,0 Percent LSD Intervals
KICHCOCA1,4
1,51,61,71,81,9
Trang 225.2 Vitamin C (mg/kg) của sản phẩm được chế biến tại thời điểm:
1 Yếu tố thí nghiệm là: Thời gian.
2 Kết quả thí nghiệm: Lượng vitamin C
3 Nghiệm thức: 5 mốc thời gian 15, 20, 25, 30, 35
4 Mỗi nghiệm thức lặp lại 5 lần, có 25 đơn vị thí nghiệm
5 Thí nghiệm cần được xử lý trong cùng 1 loại dụng cụ; cùng 1 loại thiết bị đo, nấu, sơ
chế; cùng 1 loại nguyên liệu (trái cây); xử lý ở cùng 1 nhiệt độ; cùng 1 người thực hiệncùng thao tác; cùng 1 loại đồng hồ bấm giờ
Trang 23- Độ lệch chuẩn và hệ số biến thiên của thời gian nấu 15 phút là nhỏnhất, cho biết cácgiá trị của mẫu được xử lý trong 15 phút có độ tập trung cao.
- Trung bình lượng vitamin C của mẫu được xử lý ở thời gian 15 phút là cao nhất vàlượng vitamin C của mẫu được xử lý ở thời gian 30 phút là thấp nhất
7 Phân tích phương sai ANOVA:
Source Sum Squares of Df Mean Square F-Ratio P-Value
Trang 2430 - 35 -2,4 3,74546
Nhận xét:
- 5 giá trị trung bình của lượng vitamin C giữa những thời gian xử lý là khác nhau
- Trong đó, giá trị trung bình giữa thời gian nấu 15 phút và 30 phút làkhác biệt có ýnghĩa thống kê, còn giá trị trung bình giữa những thời gian nấu khác là khác biệt không
có ý nghĩa thống kê ở độ tin cậy 95%
9 Biểu đồ mean plot.
Nhận xét:
- Ở độ tin cậy 95%, đồ thị của thời gian:
+ 15 phút và 30 phút không cắt nhau, khác biệt là có ý nghĩa thống kê
+ 15 phút – 20 phút, 15 phút – 25 phút, 15 phút – 35 phút có cắt nhau, khác biệt làkhông có ý nghĩa thống kê
+ 20 phút và 25 phút gần như trùng nhau; 20 phút – 35 phút và 25 phút – 35 phút có cắtnhau - khác biệt giữa chúng là không có ý nghĩa thống kê
10 Kết luận của thí nghiệm:
Means and 95,0 Percent LSD Intervals
THOIGIAN 20
22 24 26 28 30
Trang 25Từ những tính toán và biểu đồ trên, ta kết luận chọn xử lý ở thời gian nấu là 15 phút vìtại thời gian nấu này lượng vitamin C là cao nhất (27,6).
5.3 Độ đậm đặc (N) của sản phẩm khi xử lý bằng 4 chất phụ gia A, B, C, D được xác định ở 4 vị trí của sản phẩm:
4 Mỗi đơn vị thí nghiệm: 16 đơn vị thí nghiệm
5 Các yếu tố đó gồm: loại sản phẩm, thành phần cấu tạo của sản phẩm, quá trình chế
biến ra sản phẩm, các thao tác, cái loại dụng cụ được sử dụng (cùng 1 loại dụng cụ thiết
bị đo), cùng 1 lượng phụ gia thêm vào, cùng 1 người thao tác, các điều kiện môi trường
Trang 26- Tại độ tin cậy 95%, có giá trị độ cứng trung bình của mẫu là 96,5
- Phụ gia D ở vị trí đo thứ 4 có giá trị độ cứng là cao nhất
7 Phân tích phương sai ANOVA:
Squares
Df Mean Square
Trang 272 - 4 * -6,25 2,19843
Nhận xét:
Trong cột các nhóm đồng nhất (Homogeneous Groups), thấy chất phụ gia 3 và 4 có dấu
X nằm lệch với 2 chất phụ gia còn lại do đó ta nhận xét chất phụ gia 3 và 4 khác biệt
có ý nghĩa thống kê với 2 chất phụ gia còn lại
- Chất phụ gia 4 sẽ cho độ cứng lớn nhất do nó có sự khác biệt mang ý nghĩa thống kê;trong khi đó 2 chất 1 và 2 có độ cứng tương đương nhau do giữa chúng không có sựkhác biệt mang ý nghĩa thống kê
9 Biểu đồ mean plot.
Nhận xét:
- Vị trí đo số 1 và 2 có điểm chung nên giữa chúng có sự khác biệt không mang ýnghĩa thống kê; còn vị trí 3, 4 với vị trí 1,2 không có điểm chung nên giữa chúng có sựkhác biệt mang ý nghĩa thống kê
10 Kết luận của thí nghiệm:
Means and 95,0 Percent LSD Intervals
POSITION 92
94 96 98 100 102
Trang 28Ta sẽ chọn sử dụng chất phụ gia D ở vị trí đo 4, do khi sử dụng D sản phẩm có độ cũngcao hơn so với các chất phụ gia khác.
Trang 295.4 Độ giòn (N) của sản phẩm khi xử lý bằng 4 tỷ lệ phụ gia (1%, 2%, 3%, 4%) được xác định ở 4 vị trí của sản phẩm:
1 Yếu tố thí nghiệm là: Tỷ lệ phụ gia và vị trí đo.
2 Kết quả thí nghiệm: Độ giòn (N)
3 Nghiệm thức: 1%, 2%, 3%, 4%
4 Mỗi đơn vị thí nghiệm: 16 đơn vị thí nghiệm
5 Các yếu tố đó gồm: cùng 1 người thực hiện thao tác, cùng 1 loại sản phẩm với cùng
thành phần nguyên liệu, cùng sử dụng 1 loại phụ gia, cùng quy trình - thao tác làm,cùng thời gian thêm phụ gia và điều kiện môi trường, cùng 1 loại dụng cụ đong mẫu
Trang 30Nhận xét:
- Tại độ tin cậy là 95%, giá trị trung bình chung cho độ chắc sản phẩm là 9,65
- Ở tỉ lệ phụ gia là 4% và ở vị trí số 4, giá trị độ giòn là lớn nhất
7 Phân tích phương sai ANOVA:
Source Sum of Squares Df Mean Square F-Ratio P-Value
Trang 31- Nhóm sử dụng tỷ lệ phụ gia là 3% và 4% có sự khác biệt so với nhóm còn lại, do đó
ta nhận xét chất phụ gia số 3% và 4% khác biệt có ý nghĩa thống kê
9 Biểu đồ mean plot.
Nhận xét:
- Đây là biểu đồ thể hiện tương quan giữa DOCHACSANPHAM và VITRI
- Vị trí đo số 1 và 2 có điểm chung nên giữa chúng có sự khác biệt không mang ý nghĩathống kê; còn vị trí 3, 4 với vị trí 1,2 không có điểm chung nên giữa chúng có sự khácbiệt mang ý nghĩa thống kê
- Độ chắc của sản phẩm cao nhất khi sử dụng tỷ lệ phụ gia là 4% Và được đo ở bất kì
vị trí nào thì độ cứng của nhóm sử dụng tỷ lệ chất phụ gia là 4% đều cao
10 Kết luận của thí nghiệm:
- Ta nên chọn tỷ lệ phụ gia là 4% vì ở tỷ lệ này dù đo ở vị trí nào thì t cũng thu được độchắc cao hơn so với các nhóm tỷ lệ còn lại, nhưng cao nhất là khi đo ở vị trí 4
Means and 95,0 Percent LSD Intervals
POSITION 9,2
9,4 9,6 9,8 10 10,2
Trang 325.5 Thí nghiệm sự gắn kết của sản phẩm được xử lý ở 4 nhiệt độ (60ºC, 65ºC, 70ºC, 75ºC), đo ở 4 vị trí trên sản phẩm:
4 Mỗi đơn vị thí nghiệm: 16 đơn vị thí nghiệm
5 Các yếu tố đó gồm: Các yếu tố cần giữ như nhau ở mỗi đơn vị thí nghiệm gồm:cùng 1 người thực hiện thao tác, cùng 1 loại sản phẩm với các thành phần nguyên liệu
có tỷ lệ như nhau, sử dụng cùng 1 loại đồng hồ bấm giờ - cùng thời gian bấm giờ, cùng
1 loại/ cái nhiệt kế đo nhiệt độ, sử dụng cùng 1 loại dụng cụ
Trang 33Nhận xét:
- Tại độ tin cậy 95%, giá trị trung bình của độ chắc sản phẩm là 7,4625
- Kết quả đo độ chắc thu được khi xử lý ở nhiệt độ 650C tại vị trí đo số 2 là cao nhất
7 Phân tích phương sai ANOVA:
Trang 34- Các giá trị trung bình của nhiệt độ xử lý không có sự khác nhau và giữa chúng không
có khác biệt mang ý nghĩa thống kê
9 Biểu đồ mean plot.
Nhận xét:
- Đây là biểu đồ thể hiện sự tương quan giữa SUGANKET và POSITION
- Các đồ thị của các vị trí đo đều có điểm chung nên giữa chúng có sự khác biệt khôngmang ý nghĩa thống kê
10 Kết luận của thí nghiệm:
- Do sự khác biệt giữa các giá trị trung bình không mang ý nghĩa thống kê nên ta có thểchọn xử lý nhiệt độ cho sản phẩm ở bất kì mức nào đều được
Means and 95,0 Percent LSD Intervals
POSITION7,1
7,37,57,77,9
Trang 355.6 Độ cứng của sản phẩm được xử lý ở 4 quy trình:
4 Mỗi đơn vị thí nghiệm: 20 đơn vị thí nghiệm
5 Các yếu tố đó gồm:cùng loại sản phẩm, quy trình sản xuất trình chế biến như nhau
Trang 36- Tại độ tin cậy 95%, giá trị trung bình của độ cứng sản phẩm là 617,7
- Kết quả đo độ cứng thu được tại power 220 tại vị trí Olservation số 1 là cao nhất
7 Phân tích phương sai ANOVA:
Squares
Df Mean Square
- Các giá trị P của các biến Power nhỏ hơn 0,05; chứng tỏ chúng có sự khác biệt
mang ý nghĩa thống kê, ảnh hưởng đến độ cứng của sản phẩm ở độ tin cậy 95%
- Giá trị P của Olservations lớn hơn 0,05 nên không có sự khác biệt mang ý nghĩathống kê ở độ tin cậy 95%
Trang 379 Biểu đồ mean plot.
10 Kết luận của thí nghiệm:
Chọn mức POWER 220W vì nó cho độ cứng lớn nhất
Means and 95,0 Percent LSD Intervals
POWER530
570610650690730
Trang 385.7 Ảnh hưởng của thức ăn đến lượng sữa bò thu được trong 4 tuần
1 Yếu tố thí nghiệm là: Cow, week, effect of food, amount of milk
2 Kết quả thí nghiệm: Ảnh hưởng của thức ăn
3 Nghiệm thức: 1, 2, 3, 4
4 Mỗi đơn vị thí nghiệm: 16 đơn vị thí nghiệm
5 Các yếu tố đó gồm:giống bò, thức ăn cho bò ăn có đảm bảo không, nguồn nước bòuống
Trang 393 4 22,0 0,554339 20,6436 23,3564
Nhận xét:
Lượng sữa đạt cao nhất khi sử dụng thực phẩm D, loại bò 1 và tuần 2
Lượng sữa đạt thấp nhất khi sử dụng thực phẩm A, loại bò 3 và tuần 1
7 Phân tích phương sai ANOVA:
Squares
Df Mean Square
Trang 40Loại bò 1,2 với 1,3 đều có sự khác biệt có ý nghĩa thống kê
Loại bò 3 và 4 có sự khác biệt có ý nghĩa thống kê
Còn loại bò 1 với 4, 2 với 3 và 2 với 4 đều có sự khác biệt không có ý nghĩa
10 Kết luận của thí nghiệm:
Ta thấy chỉ có loại bò 1 là cho lượng sữa cao nhất và loại bò 1-4 thì có sự khác biệtkhông có ý nghĩa thống kê nên ta sẽ chọn loại bò 1
Ta thấy chỉ có loại thực phẩm D là cho lượng sữa cao nhất và loại thực phẩm C-D thì
có sự khác biệt không có ý nghĩa thống kê nên ta sẽ chọn loại thực phẩm D
Ta thấy tuần 2 là cho lượng sữa cao nhất và tuần 2-4,2-3 thì có sự khác biệt không có ýnghĩa thống kê nên ta sẽ thực hiện trong tuần 2
Means and 95,0 Percent LSD Intervals
ADDITIVES 19
21 23 25 27 29