Nó là một phần quan trọng của nghiên cứu và khoa học, cũng như trong nhiều lĩnh vực khác như kinh doanh, y tế, xã hội học và công nghệ thông tin Vd: Một chủ nhà hàng muốn biết được mức đ
Trang 1TRƯỜNG ĐẠI HỌC NÔNG LÂM TP.HỒ CHÍ MINH KHOA CÔNG NGHỆ HÓA HỌC VÀ THỰC PHẨM
Môn: LUẬT AN TOÀN THỰC PHẨM GVHD: Thầy Nguyễn Anh Trinh
Sinh viên: Trần Kiều Châu
Trang 2THỐNG KÊ ỨNG DỤNG & PHƯƠNG PHÁP THÍ NGHIỆM
Chương 1: Tổng quan về thống kê ứng dụng (Introductione to applied
statistics)
Chương 2: Thống kê mô tả (descriptive statistics)
Chương 3: Thiết kế thử nghiệm (Experimental designs)
Chương 4: Thiết kế 2 nhóm (two – group designs)
Chương 5: Thiết kế nghiên cứu khác nhau (different research designs)
Chương 6: Thiết kế giai thừa (Factorial design)
Chương 7: Mô hình hồi quy (Regression model)
Chương 8: Thiết kế tối ưu (Optimal design)
Chương 9: Hình thức phân bố (Shapes of distribution)
Chương 10: Thống kê suy luận ( Inferential statistics)
CHƯƠNG 1 Câu1: What is statistics? For example?
- Thống kê là quá trình thu thập, tổ chức, phân tích và diễn giải dữ liệu số để đưa
ra những thông tin hữu ích và kết luận chính xác Nó là một phần quan trọng của nghiên cứu và khoa học, cũng như trong nhiều lĩnh vực khác như kinh doanh, y tế, xã hội học và công nghệ thông tin
Vd: Một chủ nhà hàng muốn biết được mức độ hài lòng của khách hàng bằng cách xem đánh giá của khách hàng sau mỗi lần trải nghiệm dịch vụ nghỉ ngơi tại đó qua app hoặc quy trình gọi điện tham khảo do nhân viên chăm sóc khách hàng gọi về cho khách hàng để xin đánh giá theo mức độ 1-5 tương đương mức độ hài lòng từ thấp đến cao
Câu2: what is applied statistics? For example
- Thống kê ứng dụng là quá trình thu thập, phân tích và hiển thị dữ liệu liên quan đến việc sử dụng một ứng dụng hoặc phần mềm Nhà phát triển và
Trang 3quản lý ứng dụng sử dụng thống kê để giải quyết những vấn đề thực tế, quyết định xem những dữ liệu nào cần thu thập, xác định cách thức thu thập
dữ liệu đó, sau đó phân tich và diễn giải bằng các công cụ, thuật toán và phần mềm thống kê
Vd: Apple có chức năng phân tích thời gian trung bình mà người dùng dành chođiện thoại hàng ngày hoặc hàng tuần Điều này có thể cung cấp thông tin về mức độ hấp dẫn của điện thoại và xác định các vấn đề có thể gây ra sự chán chường cho người dùng
Câu 3: What are the limitations of statistics? For example
Hạn chế của thống kê
- Sử dụng thống kê phải biết lĩnh vực chuyên môn nghiên cứu
- Thống kê chỉ là phương tiện, công cụ, trình bày số liệu hoặc hiện tượng rời rạcmột cách hệ thống hơn, chứ rạc một cách hệ thống hơn, chứ không nói được bản chất của sự việc
- Thống kê không thay thế cho suy nghĩ và kết luận của người nghiên cứu
Vd: Nếu một mẫu không đại diện cho toàn bộ quần thể hoặc có sự thiên vị trongquá trình thu thập dữ liệu, thì kết quả thống kê sẽ không chính xác
Câu 4: What is the descriptive statistics? For example
- Thống kê mô tả là những bước đầu tiên để phân tích vấn đề và thực hiện quyết định Gồm các tính toán cơ bản mang tính mô tả như trung bình, phường sai, độ lệch chuẩn , nhằm tổng kết về kết quả thí nghiệm Phương pháp này thường được sử dụng để biểu diễn dữ liệu một cách trực quan, giúpngười đọc hiểu được các đặc điểm cơ bản của tập dữ liệu mà không cần phảithực hiện các phép tính phức tạp
Vd: Các biểu đồ cột, tròn, đường,… để biểu diễn tần suất, phần trăm hay sự biến đổi của các biến trong một đơn vị thời gian nào đó
Câu 5: What is the inferential statistics? For example
- Thống kê suy diễn là quá trình khái quát hóa thông tin của một mẫu cho toàndân số của mẫu, tức là chỉ đo đếm trên môt tiểu tập hợp rôi suy luận cho
Trang 4toàn bộ với một độ tin cậy nào đó Cung cấp kỹ thuật để kiểm tra trên một mẫu và sử dụng thông tin này để suy rộng ra các đặc tính của toàn bộ dân số.Vd: Giả sử bạn muốn biết tỉ lệ người dân trong một xã tiêu thụ điện ít hay nhiều Thay vì điều tra toàn bộ dân số của xã đó, bạn chỉ thu thập thông tin từ một mẫu ngẫu nhiên gồm khoảng 50 hộ dân Sau khi phân tích, bạn tìm thấy rằng trong mẫu này, có trên 30 hộ sử dụng điện dưới 100kg/tháng Bạn nhận thấy trong xã này người dân tiêu thụ điện không nhiều
Câu 6: what is the sample? For example
- Mẫu được chọn ngẫu nhiên từ dân số Số phần tử trong mẫu gọi kich thước mẫu, hay cỡ mẫu, ký hiệu n Các thí nghiệm được tiến hành trên mẫu Kết quả thu được qua xử lý thống kê để suy rộng ra cho cả dân số
Vd: Ở vd5, 50 hộ dân là mẫu của cả một xã trên
Câu 7: What is the population? For example
- Dân số là tập hợp chứa mọi phần tử thuần nhất theo tiêu chuẩn nào đó Ký hiệu số cá thể của dân số là N N có thể lớn đến vô cùng Nghiên cứu toàn
bộ các cá thể N của dân số là không thể thực hiện được
Vd: ở vd 5, dân số là tập hợp tất cả hộ dân trong xã
Câu 8: what are type of food research study? For example
mà doanh số bán tăng lên đáng kể và người tiêu dùng cũng biết đến hàn cà phê nàynhiều hơn
Câu 9: what is variable? For example
- Biến là một đặc điểm, một thuộc tính, hoặc một số lượng có thể thay đổi giữa các trường hợp hoặc cá thể trong một nghiên cứu Biến thường được
Trang 5quan tâm vì chúng có thể ảnh hưởng đến kết quả của nghiên cứu hoặc được
sử dụng để giải thích sự biến đổi trong các kết quả
Ví dụ: Chiều cao, cân nặng, độ tuổi, học vấn, dân số, là các yếu tố có thể tự thay đổi hoặc bị thay đổi => Biến
Câu 10: what is probability? For example
- Xác suất được sử dụng để đo lường khả năng xảy ra của một sự kiện cụ thể Xác suất thường được biểu diễn dưới dạng một con số từ 0 đến 1 Xác suất
là một công cụ quan trọng trong nhiều lĩnh vực như kinh tế, khoa học dữ liệu, y học, và công nghệ thông tin, nơi nó được sử dụng để dự đoán, phân tích rủi ro, và ra quyết định dựa trên dữ liệu
Vd: Giả sử bạn tung một con xúc xắc và mong muốn nhận được một kết quả là mặt
số 2 Xác suất để mặt số 2 xuất hiện trên con xúc xắc là 1 trên tổng 6 mặt, tức 1/6 (0.1666)
CHƯƠNG 2 2.1 The product cost for 29 observations is as follows:
Trang 62.2 Một vài đặc tính của chất khoảng trong sản phẩm B và W như sau:
Giá trị trung bình Trung vị Độ lệch chuẩnSản phẩm B
Sản phẩm W
28722744
22122205
374250Tính toán hệ số độ lệch của mỗi nhóm và nhận xét kết quả?
Độ lệch = giá trị trung bình−trung vị độ lệchchuẩn
Độ lệch của B = giá trị trung bình−trung vị độ lệchchuẩn = 2872−2212
Trang 71.Sản phẩm phẩm từ thịt
2.Sản phẩm hải sản (Hàu đông lạnh)
Trang 83.Sản phẩm rau củ quả (rau củ quả sấy)
Trang 94.Sản phẩm trái cây (nước ép trái cây)
Trang 105.Sản phẩm ngũ cốc (sữa đậu nành tiệt trùng)
Trang 116.Sản phẩm bột (Sữa bột)
Trang 127.Sản phẩm phẩm trứng (mì tươi)
Trang 148.Sản phẩm rong rong biển
9.Sản phẩm trà/ cà phê (trà)
10.Sản phẩm sữa (phô mai tươi)
Trang 153.2 Nghiên cứu quy trình bảo quản sản phẩm
1.Ngũ cốc
Trang 162.Trứng (bảo quản quản trong kho lạnh)
Trang 173.Rong biển
Trang 184.Khoai tây
Trang 195.Củ (tương tự với khoai tây)
Trang 206.Thịt
Trang 21PHẦN 2: THỰC HÀNH
CHƯƠNG 4 4.1: Độ Brix của nước ép xoài trong quy trình sản xuất từ vật liệu thô A và B:
Trang 23Sum 118.7 136.6
So sánh giá trị trung bình
Mẫu 1: 7 giá trị nằm trong khoảng từ 14.8 đến 19.1
Mẫu 2: 7 giá trị nằm trong khoảng từ 17.2 đến 21.1
Giá trị trung bình của A với độ tin cậy 95%: 16,9571 +/- 1,4455 [15,5116, 18,4026]
Giá trị trung bình của B với độ tin cậy 95%: 19,5143 +/- 1,19806 [18,3162, 20,7123]
Giả sử 2 phương sai bằng nhau, sự khác nhau giữa 2 giá trị trung bình với độ tin cậy 95% là: -2,55714 +/- 1,67175 [-4,22889; \-0,885395]
Kiểm định t so sánh giá trị trung bình:
Trang 24B3
Trang 285.9 6.1 6.3 6.5 6.7 6.9 7.1
B 4
Trang 32None heat treatment
Heat treatment 4
2 0 2 4
Trang 33Box-and-Whisker Plot
eat treatment
eat treatment
Kết luận về lượng vi sinh vật trong sản phẩm (cfu/g thấp nhất)
- Có p > 0.05 với độ tin cậy 95% => sự khác biệt không có ý nghĩa thống kế => Chọn quá trình nào xử lý cũng đều được
4.4: Lượng Glycogen trong sản phẩm (mg/g) được xử lý qua 2 quy trình như sau:
Trang 36Microware 5
3 1 1 3 5
Trang 37Box-and-Whisker Plot
Oven
Microware
Kết luận về lượng Glycogen trong sản phẩm (mg/g cao nhất)
- Có p < 0,05 => Sự khác biệt có ý nghĩa thống kê => Lượng Glycogen trong phương pháp OVEN cao hơn => Chọn phương pháp OVEN xử lý
Trang 381 1.57 1.64 1.71
1 Hệ số thực nghiệm: Kích cỡ cá
2 Kết quả của thí nghiệm: Định mức sơ chế
3 Thực nghiệm của thí nghiệm: cỡ cá A, B, C
4 Có bao nhiêu thí nghiệm được tiến hành: Có 9 TN được tiến hành
5 Đâu là nhân tố khác: Thao tác lấy, điều kiện lấy, thời gian cho ăn…
6 Mô tả thông số thống kê:
+ Dependent variable: DINHMUC
Standard deviation
Coeff of variation
Minimum
Maximum
Range
Stnd skewness
7 Mô tả phân tích phương sai một yếu tô ANOVA?
ANOVA Table for DINHMUC by KICHCOCA
Source Sum of Df Mean F-Ratio P-Value
Trang 39Squares SquareBetween
+/- Limits
-0.0766667
0.115541
* denotes a statistically significant difference
Nhận xét: Với độ tin cậy 95% thì:
Trang 40Các cặp A-B; A-C : khác biệt có ý nghĩa thống kê
Cặp B-C: khác biệt không có ý nghĩa thống kê
9 Trình bày biểu đồ mean plot?
Means and 95.0 Percent LSD Intervals
KICHCOCA 1.4
1.5 1.6 1.7 1.8
Nhận xét: Yếu tố A khác biệt có ý nghĩa thông kế với B,C
Yếu tố B và C khác biệt không có ý nghĩa thống kê
10 Định mức sơ chế thấp nhất: Chọn A là định mức sơ chế thấp nhất
5.2 Lượng vitamin C của sản phẩm được sơ chế vào các mốc thời gian:
Thời gian xử lý nhiệt
Trang 415 29 23 28 21 28
1.Yếu tố thí nghiệm: thời gian xử lý
2.Kết quả thí nghiệm: lượng Vitamin C của sản phẩm
3.Nghiệm thức của thí nghiệm: 15, 20, 25, 30, 35
Average
Standard deviation
Coeff of variation
Minimum
Maximum
Range
Trang 42Homogeneous Groups
+/- Limits
15 - 20 2,0 3,81909
15 - 25 2,2 3,81909
15 - 30 * 4,8 3,81909
Trang 4322 24 26 28 30
1.Yếu tố thí nghiệm: phụ gia và vị trí đo
2.Kết quả thí nghiệm: độ cứng của sản phẩm
3.Nghiệm thức của thí nghiệm:
+Phụ gia đo: A, B, C, D
+Vị trí đo: 1,2,3,4
Trang 44Standard deviation
Coeff of variation
Minimum
Maximum
Range
Stnd skewness
Standard deviation
Coeff of variation
Minimum
Maximum
Range
Stnd skewness
Trang 45F-ValueMAIN EFFECTS
LS Sigma
Homogeneous Groups
05
X
Trang 46+/- Limits
LS Sigma
Homogeneous Groups
Trang 47+/- Limits
95 97 99 101
95 97 99 101
10 Ta sẽ chọn sử dụng chất phụ gia D ở vị trí đo 4, do khi sử dụng D sản phẩm có
độ cứng cao hơn so với các chất phụ gia khác
Trang 481.Yếu tố thí nghiệm: vị trí đo, tỉ lệ chất phụ gia
2.Kết quả thí nghiệm: độ mềm của sản phẩm
Standard deviation
Coeff of variation
Minimum
Maximum
Range
Stnd skewness
Summary Statistics for FRACTURABILITY
ADDITIV Coun Avera Standard Coeff of Minimu Maxim Rang Stnd
Trang 49ES t ge deviation variation m um e skewness
FRACTURABILITY by ADDITIVES
Squares
Df Mean Square
Ratio
F-ValueMAIN EFFECTS
A:ADDITIVES 0,385 3 0,128333 14,44 0,0009
B:POSITION 0,825 3 0,275 30,94 0,0000
89TOTAL
(CORRECTED)
Trang 50LS Sigma
Homogeneous Groups
+/- Limits
Trang 51ON t Mean Sigma Groups
+/- Limits
Trang 521 2 3 4 Means and 95,0 Percent LSD Intervals
POSITION 9,3
9,5 9,7 9,9 10,1
9,5 9,7 9,9 10,1
10 Ta nên chọn tỷ lệ phụ gia là 4% vì ở tỷ lệ này dù đo ở vị trí nào thì t
cũng thu được độ chắc cao hơn so với các nhóm tỷ lệ còn lại, nhưng cao nhất là khi
đo ở vị trí 4
5.5
1.Hệ số thực nghiệm: Vị trí, Nhiệt độ
2.Kết quả thưc nghiệm: Độ liên kết
3.Thực nghiệm của thí nghiệm:
-Vị trí: 1,2,3,4
-Nhiệt độ: 60,65,70,75
4.Sô lần chạy thực nghiệm: 16
5.các yéu tố khác:
6.Mô tả các thông số thống kê:
Table of Least Squares Means for DOLIENKET with 95.0 Percent
Confidence Intervals
Trang 537.48889
9
4.44704E-9
7.48889
7.48889
9
4.31832E-9
7.48889
7.48889
9
4.04862E-9
7.48889
7.48889
7.Mô tả phân tích phương sai ANOV:
Analysis of Variance for DOLIENKET - Type III Sums of Squares
Squares
Df Mean Square
Trang 54All F-ratios are based on the residual mean square error.
thống kê đến DOLIENKET ở mức độ tin cậy 95,0%
LS Mean
LS Sigma
Homogeneous Groups
+/- Limits
7 - 7.2 * -0.2 1.91127
E-8
7 - 7.3 * -0.3 2.13687
E-8
Trang 55* -0.1 1.87683
E-87.2 -
7.4
* -0.2 1.84175
E-87.2 -
7.5
* -0.3 2.67871
E-87.2 -
7.6
* -0.4 2.10612
E-87.2 -
7.7
* -0.5 1.63539
E-87.2 -
7.8
* -0.6 2.67871
E-87.2 -
7.9
* -0.7 2.13687
E-87.3 -
7.4
* -0.1 1.51099
E-87.3 -
7.5
* -0.2 2.69085
E-87.3 -
7.6
* -0.3 1.91127
E-87.3 -
7.7
* -0.4 1.87683
E-87.3 -
7.8
* -0.5 2.69085
E-87.3 -
7.9
* -0.6 2.51544
E-87.4 -
7.5
* -0.1 2.60463
E-8
Trang 567.4 -
7.6
* -0.2 1.75097
E-87.4 -
7.7
* -0.3 1.84175
E-87.4 -
7.8
* -0.4 2.60463
E-87.4 -
7.9
* -0.5 2.47624
E-87.5 -
7.6
* -0.1 2.21187
E-87.5 -
7.7
* -0.2 2.67871
E-87.5 -
7.8
* -0.3 2.31279
E-87.5 -
7.9
* -0.4
2.9785E-87.6 -
7.7
* -0.1 2.10612
E-87.6 -
7.8
* -0.2 2.21187
E-87.6 -
7.9
* -0.3 2.56678
E-87.7 -
7.8
* -0.1 2.67871
E-87.7 -
7.9
* -0.2 2.13687
E-87.8 -
7.9
* -0.1
2.9785E-8
* denotes a statistically significant difference
Nhận xét: với mức ý nghĩa 95%: Tất cả các cặp yêu tố trên đều có sự khác biệt có
ý nghĩa thống kê
9.Biểu đồ mean plot:
Trang 571 2 3 4 Means and 95.0 Percent LSD Intervals
VITRI 7.1
Kết luận: Vì một giá trị P nhỏ hơn 0,05 nên yếu tố này có ảnh hưởng có ý nghĩa
thống kê đến DOLIENKET ở mức độ tin cậy 95,0% Do đó để độ liên kết cao nhất
6.Mô tả các thông số thống kê:
Summary Statistics for DOCUNG
Trang 58200 -0.39162
7 Phương sai ANOVA:
ANOVA Table for DOCUNG by NANGLUONG
-Nhận xét: Vì giá trị P nhỏ hơn 0,05 nên có sự khác biệt có ý nghĩa thống kê giữa
giá trị trung bình DOCUNG từ cấp độ NANGLUONG này đến cấp độ khác ở mức
* denotes a statistically significant difference.
Nhận xét: Tất cả các cặp yếu tố trên đều có sự khác biệt có ý nghĩa thống kê
Trang 59160 180 200 220 Means and 95.0 Percent LSD Intervals
NANGLUONG 530
-Kết luận: Vì giá trị P nhỏ hơn 0,05 nên có sự khác biệt có ý nghĩa thống kê giữa
giá trị trung bình DOCUNG từ cấp độ NANGLUONG này đến cấp độ khác ở mức
độ tin cậy 95,0% Do đó để độ cứng đạt giá trị cao nhất thì năng lượng phải đạt là 222W
5.7
1 Hệ số thực nghiêm: week, cow,food
2.Kết quả thực: amount of milk
3.Thực nghiệm cua thí nghiệm:
Trang 607.phương sai ANOVA:
Analysis of Variance for AMOUNT OF MILK - Type III Sums of Squares
All F-ra琀椀os are based on the residual mean square error.
Nhận xét: Vì 2 giá trị P nhỏ hơn 0,05 nên các yếu tố này có ảnh hưởng có ý nghĩa
thống kê đến SỐ LƯỢNG SỮA ở mức độ tin cậy 95,0%
Trang 612 - 4 0.0 2.85838
* denotes a sta琀椀s琀椀cally signi昀椀cant di昀昀erence.
Nhận xét:
-Các cặp yếu: 1-2,1-3,1-4 biểu thị sự khác biệt có ý nghĩa thống kê
-Các cặp yếu tố: 2-3,2-4,3-4 biểu thị sự khác biệt không có ý nghĩa thống kê
9.biểu đồ mean plot:
Means and 95.0 Percent LSD Intervals
COW 20
10.Kết luận: Vì 2 giá trị P nhỏ hơn 0,05 nên các yếu tố này có ảnh hưởng có ý
nghĩa thống kê đến SỐ LƯỢNG SỮA ở mức độ tin cậy 95,0%.Chọn thời gian là 1 tuần ở cột 1 để lượng sữa cao nhất
CHƯƠNG 6 6.1 Lượng Alginate đến từ tảo biển được xử lý bằng Na2CO3 ở nộng độ, 3 tỷ
lệ rong biển như sau:
1 Đâu là yếu tố thí nghiệm?
Trang 62- Tỷ lệ rong biển, nồng độ Na2CO3
2 Đâu là kết quả thí nghiệm?
- Lượng Alginate thu được
3 Nghiệm thức của thí nghiệm là gì?
- A (0.5; 1.0; 1.5), B (0.5; 1.0; 1.5), C (0.5; 1.0; 1.5)
4 Có bao nhiêu thí nghiệm được thực hiện?
- Có 27 thí nghiệm được thực hiện
5 Các yếu tố khác cần giữ như nhau là gì?
- Cách pha dung dịch, thao tác thí nghiệm, điều kiện khuấy trộn, cùng một loại rong biển, cùng thời gian thí nghiệm…
6 Mô tả các đại lượng thống kê?
Table of Least Squares Means for LUONG with 95.0 Percent Confidence Intervals
8.85588
11.1997
99
17.9881
20.3319
2
0.557799
13.1703
15.5141TYLE
6
0.557799
11.4937
13.8375
8
0.557799
13.8659
16.2097
7
0.557799
14.6548
16.9986NONGDO by
TYLE
0.5,A 3 8.2833 0.9661 6.2535 10.313