Mẫu là lựa chọn ngẫu nhiên của tổng thể và là một nhóm nhỏ được rút ra từ tổngthể, có các đặc điểm của toàn bộ tổng thể.Ví dụ: Người ta chọn ta 200 bóng đèn mà công ty A sản xuất làm mẫu
Trang 1TRƯỜNG ĐẠI HỌC NÔNG LÂM TP HỒ CHÍ MINH
KHOA CÔNG NGHỆ HOÁ HỌC & THỰC PHẨM
Trang 2Bài tập 1
1 Thống kê:
Thống kê là một hệ thống các phương pháp sử dụng mô hình, sự biểu diễn vàtóm tắt định lượng một tập dữ liệu thực nghiệm hoặc nghiên cứu thực tế nhấtđịnh nhằm phục vụ cho quá trình phân tích, dự đoán và ra quyết định
Ví dụ: Dưới đây là số liệu thống kê của một cuộc điều tra về số dân phân định
theo giới tính và phân theo thành thị, nông thôn tại một số tỉnh, Thành phố tạiViệt Nam
2 Thống kê ứng dụng:
Thống kê ứng dụng bao gồm lập kế hoạch về thu thập dữ liệu, quản lý dữ liệu,phân tích, diễn giải và rút ra kết luận từ dữ liệu đó đồng thời xác định các vấn đề,giải pháp bằng cách sử dụng phân tích
Trang 3Các nhà thống kê sử dụng số liệu thống kê ứng dụng để giải quyết các vấn đềthực tế, quyết định dữ liệu nào cần thu nhập, xác định cách thu nhập dữ liệu đó.Sau đó phân tích và diễn giải dữ liệu bằng các công cụ, thuật toán và phần mềmthống kê.
Ví dụ: Xác định xu hướng thị trường chứng khoán
_Số liệu thống kê có thể bị lạm dụng: hạn chế lớn nhất của số liệu thống kê là nó
có thể bị lạm dụng Việc lạm dụng số liệu thống kê có thể phát sinh một số lý do
Ví dụ: kết luận thống kê dựa trên thông tin không đầy đủ, có thể dẫn đến sai lầm.
Lập luận cho rằng uống bia có hại cho tuổi thọ vì 99% ố người uống bia chết
Trang 4trước 100 là sai sót về mặt thống kê, vì chúng ta không biết bao nhiêu phần trăm
số người không uống bia chết trước tuổi dố
_Số liệu thống kê là tổng hợp của các sự kiện, vì vậy một quan sát đơn lẻ khôngphải là số liệu thống kê
4 Thống kê mô tả (descriptive statistics):
Thống kê mô tả được hiểu là các phương pháp liên quan đến việc thu thập số liệu,tóm tắt, trình bày, tính toán và mô tả các đặc trưng khác nhau để phản ánh mộtcách tổng quát đối tượng nghiên cứu
Ví dụ: Điểm trung bình của học sinh (GPA) là một dạng thông tin có được từ ứng
dụng thống kê mô tả trong thực tiễn GPA là trung bình của dữ liệu từ một loạtcác bài kiểm tra, lớp học và điểm số với nhau để xem xét khả năng học tập chungcủa học sinh Điểm trung bình cá nhân của học sinh phản ánh kết quả học tậptrung bình chung của học sinh đó
Trang 55 Thống kê suy luận (inferential statistics):
Thống kê suy luận bao gồm các phương pháp ước lượng các đặc trưng của tổngthể, phân tích mối liên hệ giữa các hiện tượng nghiên cứu, dự đoán hoặc ra quyếtđịnh trên cơ sở thu thập thông tin từ kết quả quan sát mẫu
Ví dụ: Một lớp học gồm 50 học sinh Trong đó, các bạn nữ cho rằng mỗi lần
kiểm tra miệng thì họ bi gọi nhiều hơn các bạn nam Họ cho rằng như vậy giáoviên đang thiên vị Còn giáo viên thi cho rằng họ thực hiện điều này là một cách
Trang 6ngẫu nhiên Và để xem ai đúng, ai sai trong trường hợp này ta sẽ cần phải đặt giảthuyết thống kê thông qua suy luận thống kê.
6 Tổng thể (population):
Tổng thể là một thuật ngữ thống kê được sử dụng để chỉ toàn bộ các cá thể hoặcđối tượng mà nhà nghiên cứu đang quan tâm trong một nghiên cứu
Trong thống kê, tổng thể là mẫu đại diện của một nhóm nười/những vật lớn hơn
có một hoặc nhiểu đặc điểm chung
Ví dụ: Tổng thể này có thể được đo lường bằng nhiều biến số như tuổi, giới tính,
dân tộc, nghề nghiệp, thu nhập, giáo dục, Khi muốn tìm hiểu về thu nhập bìnhquân của cả dân cư Việt Nam, ta sẽ cần phải xác định tổng thể là tất cả các cưdân trong đất nước này Tuy nhiên, để thực hiện việc điều tra, ghi chép và phântích một tổng thể với hàng triệu người sẽ là một nhiệm vụ khó khăn và tốn kém.Thay vào đó, ngành thống kê sẽ chọn ra một mẫu gồm một số đơn vị đại diện chotổng thể và tiến hành điều tra trên mẫu này Ví dụ, ngành thống kê Việt Nam cóthể chọn ra một mẫu ngẫu nhiên gồm 1.000 người trong dân số 100 triệu người
để điều tra thu nhập của họ Sau đó, dựa trên kết quả điều tra mẫu này, ngànhthống kê sẽ suy ra thông tin về thu nhập bình quân của toàn bộ dân cư Việt Nam
7 Mẫu (sample):
Mẫu là một bộ phận của một tổng thể (thống kê) có thể dùng để thực hiện cácước lượng về tổng thể mà không phải tiến hành tổng điều tra về toàn bộ các đơn
vị của một tổng thể
Trang 7Mẫu là lựa chọn ngẫu nhiên của tổng thể và là một nhóm nhỏ được rút ra từ tổngthể, có các đặc điểm của toàn bộ tổng thể.
Ví dụ: Người ta chọn ta 200 bóng đèn mà công ty A sản xuất làm mẫu để kiểm
tra tuổi thọ của chúng
8 Các loại nghiên cứu thực phẩm (Types of Food research study):
Các loại hình sản xuất thực phẩm:
Sản xuất thực phẩm được phân loại thành nhiều loại khác nhau bao gồm trồngtrọt, lựa chọn, quản lý cây trồng, thu hoạch, sản xuất cây trồng, bảo quản, nướng,thanh trùng, bánh pudding, chạm khắc, giết thịt, lên men, ngâm chua, làm đồuống và kẹo, nhà hàng, v.v
Trang 8_Luộc, nướng, chiên, nướng, hấp và trộn.
_Thanh trùng
_Chế biến nước trái cây
_Loại bỏ các lớp bên ngoài bằng cách lột và lột da
_Khí hóa nước giải khát
_Bảo quản và đóng gói thực phẩm bằng túi hút chân không
9 Biến (variable):
Biến trong Toán học được định nghĩa là ký tự chữ cái biểu thị một giá trị số hoặcmột số Trong các phương trình đại số, một biến được sử dụng để biểu diễn mộtđại lượng chưa biết
Các biến này có thể là bất kỳ bảng chữ cái nào từ a đến z Thông thường nhất,'a','b','c', 'x','y' và 'z' được sử dụng làm biến trong phương trình
Thực hiện các phép tính số học với các biến như thể chúng là các số rõ ràng chophép người ta xử lý phạm vi vấn đề trong một phép tính đơn độc Một minh họathông thường là một công thức bậc hai, cho phép người ta giải thích từng điềukiện bậc hai bằng cách thay thế các ước lượng bằng số của các hệ số của điềukiện đưa ra bằng các biến đại diện cho chúng
Ý tưởng về một biến có ý nghĩa quan trọng trong toán học Thông thường, mộthàm y = f(x) bao gồm hai biến y và x, đại diện riêng cho chất lượng và sự tranhchấp của hàm Cụm từ “biến” bắt nguồn từ việc khi đối số (còn gọi là “biến côngsuất”) dịch chuyển thì chất lượng cũng thay đổi tương ứng
10 Xác suất (Probability)
Xác suất là thước đo khả năng xảy ra một sự kiện Nhiều sự kiện không thể dựđoán được một cách hoàn toàn chắc chắn Chúng ta chỉ có thể dự đoán khả năngxảy ra một sự kiện, tức là khả năng chúng sẽ xảy ra bằng cách sử dụng nó Xácsuất có thể nằm trong khoảng từ 0 đến 1, trong đó 0 có nghĩa là sự kiện không thểxảy ra và 1 biểu thị một sự kiện nhất định Xác suất vào lớp 10 là một chủ đềquan trọng đối với học sinh, nó giải thích tất cả các khái niệm cơ bản của chủ đềnày Xác suất của tất cả các sự kiện trong không gian mẫu có tổng bằng 1
Trang 9Ví dụ: khi chúng ta tung một đồng xu, chúng ta nhận được Đầu HOẶC Đuôi, chỉ
có hai kết quả có thể xảy ra (H, T) Nhưng khi tung hai đồng xu thì sẽ có bốn kếtquả có thể xảy ra, tức là {(H, H), (H, T), (T, H), (T, T)}
Trang 11Nhận xét: Vì S = 0.94817> 0 nên phân bố dữ liệu lệch về bên phải.
2.2 Given a set of observations X={3, 5, 6, 7, 0} Calculate the mean, standarddeviation and median ?
Calculate the mean
Số liệu có sự biến thiên xung quanh giá trị trung bình
2.4 Some characteristics of tmineral contents for B and W product are as follows:
2.5 Write down a list of 10 numbers satisfying both the following criteria:
(a) the median < the mean
(b) the mode < the median
{1,2,2,3,5,7,9,10,12,15}
a) Median=6<mean=6.6
b) Mode=2< Median=6
BÀI TẬP 3:
Trang 12THIẾT KẾ THÍ NGHIỆMNghiên cứu quá trình phát triển:
1 Sản phẩm thịt: xúc xích Đức
Trang 132 Sản phẩm thuỷ sản: cá nục đóng hộp sốt cà
3 Sản phẩm thực vật: cà chua đóng hộp bóc vỏ
Trang 144 Sản phẩm trái cây: dứa nước đường
Trang 155 Sản phẩm sữa: sữa chua đón hộp
Trang 166 Sản phẩm ngũ cốc: bột ngũ cốc dinh dưỡng
Trang 17Ngũ cốc Mạch nha Dầu thực vật
Trộn Nghiền
Các chất vi
Nước
Bột nền
Sản phẩm
Trang 187 Sản phẩm dạng bột: tinh bột khoai mì
8 Sản phẩm trứng: bánh flan
Trang 199 Sản phẩm rong biển: nước rong biển
Trang 2010 Sản phẩm trà: trà Kombucha
Trang 21Nghiên cứu quá trình bảo quản
1 Bảo quản ngũ cốc:
Trang 222 Bảo quản trứng:
Trang 233 Bảo quản rong biển:
4 Bảo quản khoai tây:
Trang 245 Bảo quản cây lấy củ: củ cải trắng
6 Bảo quản thịt: thịt lợn
Trang 257 Bảo quản cá:
Trang 268 Bảo quản rau:
Trang 279 Bảo quản trái cây:
Trang 2810 Bảo quản sữa:
Trang 291.Xác định tham số thống kê : là thống kê mô tả
A : 7 giá trị nằm trong khoảng giá trị từ 14,8 đến 19,1
B : 7 giá trị nằm trong khoảng giá trị từ 17,2 đến 21,1
Trang 30so với mức chuẩn, điều này có xu hướng làm mất hiệu lực các thử nghiệm sosánh độ lệch chuẩn Trong trường hợp này, cả hai giá trị độ lệch được tiêu chuẩnhóa đều nằm trong phạm vi dự kiến Cả hai giá trị độ nhọn được tiêu chuẩn hóađều nằm trong phạm vi dự kiến.
2 So sánh trung bình hai mẫu:
Khoảng tin cậy 95,0% cho sự khác biệt giữa các phương tiện
giả sử phương sai bằng nhau: -2,52857 +/- 1,67715 [-4,20572, -0,851424]kiểm tra t để so sánh có nghĩa là
Giả thuyết không: giá trị trung bình1 = giá trị trung bình2
thay thế giả thuyết: trung bình1 NE trung bình2
giả sử phương sai bằng nhau: t = -3,28492 Giá trị P = 0,0065204
Bác bỏ giả thuyết không với alpha = 0,05
The StatAdvisor
Trang 31Tùy chọn này chạy thử nghiệm t để so sánh giá trị trung bình của hai mẫu Nócũng xây dựng các khoảng hoặc giới hạn tin cậy cho từng giá trị trung bình vàcho sự khác biệt giữa các giá trị trung bình Điều đặc biệt quan tâm là khoảng tincậy cho sự khác biệt giữa các giá trị trung bình, kéo dài từ -4,20572 đến -
0,851424 Vì khoảng không chứa giá trị 0 nên có sự khác biệt có ý nghĩa thống
kê giữa giá trị trung bình của hai mẫu ở mức độ tin cậy 95,0%
Phép thử t cũng có thể được sử dụng để kiểm tra một giả thuyết cụ thể về sự khácbiệt giữa giá trị trung bình của các tổng thể chứa hai mẫu Trong trường hợp này,phép thử được xây dựng để xác định xem chênh lệch giữa hai giá trị trung bình
có bằng 0,0 hay không so với giả thuyết thay thế rằng chênh lệch không bằng 0,0
Vì giá trị P được tính toán nhỏ hơn 0,05 nên chúng ta có thể bác bỏ giả thuyếtkhông và ủng hộ phương án thay thế
LƯU Ý: những kết quả này giả định rằng phương sai của hai mẫu là bằng nhau.Trong trường hợp này, giả định đó có vẻ hợp lý dựa trên kết quả của phép thử F
để so sánh độ lệch chuẩn Bạn có thể xem kết quả của bài kiểm tra đó bằng cáchchọn So sánh độ lệch chuẩn từ menu Tùy chọn dạng bảng
3 Biểu diễn biểu đồ phân phối tần suất ?
Trang 32*Nhận xét:
A
B 3
2 1 0 1 2 3
Trang 3395.0% confidence interval for the difference between the means
assuming equal variances: 0.278333 +/- 0.429714 [-0.15138;0.708047]
t test to compare means
Null hypothesis: mean1 = mean2
Alt hypothesis: mean1 NE mean2
assuming equal variances: t = 1.44321 P-value =0.179546
Do not reject the null hypothesis for alpha = 0.05
Trang 34pHA
pHB 4
2 0 2 4
Trang 3595.0% confidence interval for the difference between the means
assuming equal variances: 0.362857 +/- 1.84258 [-1.47972; 2.20543]
t test to compare means
Null hypothesis: mean1 = mean2
Alt hypothesis: mean1 NE mean2
assuming equal variances: t = 0.429073 P-value =0.675473
Do not reject the null hypothesis for alpha = 0.05
3
NONEHEATTREATMENT
HEATTREATMENT 4
2 0 2 4
Trang 3695.0% confidence interval for the difference between the means
assuming equal variances: 10.1429 +/- 7.32177 [2.82108;17.4646]
t test to compare means
Null hypothesis: mean1 = mean2
Alt hypothesis: mean1 NE mean2
assuming equal variances: t = 3.01832 P-value =0.0106963
Reject the null hypothesis for alpha = 0.05
3
OVEN
MICROWARE 5
3 1 1 3 5
Trang 37P-value =0.0106963< 0.05 2 giá trị trung bình khác biệt có ý nghĩa thống kê
ở độ tin cậy 95% Highest OVEN
Trang 38Bài tập 5:
5.1
1 Yếu tố thí nghiệm là Fish size: A, B, C
2 Kết quả thí nghiệm là số liệu về tiêu chuẩn của sản phẩm đó đối với 3 kích cỡ
Trang 39Multiple Range Tests for DINHMUC by FISHSIZE
Trang 40A B C
Means and 95.0 Percent LSD Intervals
FISHSIZE 1.4
- Từ bảng phân tích phương sai ANOVA: P =0.0208< 0.05 ở độ tin cậy 95%
giá trị trung bình khác biệt có ý nghĩa thống kê, yếu tố kích cỡ cá ảnh hưởngđến định mức
- Xét ở độ tin cậy 95%, kích cỡ cá A có giá trị tiêu chuẩn trung bình thấp nhất.Kích cỡ cá A không trùng kích cỡ cá B, C nên có ý nghĩa thống kê Kích cỡ cá B,
C trùng nhau nên không có ý nghĩa thống kê
5.2
1 Yếu tố thí nghiệm là thời gian chế biến sản phẩm
2 Kết quả thí nghiệm là số liệu về hàm lượng vitamin C trong sản phẩm ở 5 thờigian chế biến khác nhau sau 5 lần lặp lại
3 Nghiệm thức của thí nghiệm là giá trị hàm lượng vitamin C trong sản phẩmtương ứng với mỗi thời gian chế biến
Trang 414 Có 25 đơn vị thí nghiệm.
5 Các yếu tố khác bao gồm quy trình sản xuất, tỷ lệ các nguyên liệu khác, địa
điểm sản xuất, thời gian sản xuất, dụng cụ đo, vị trí đo, điều kiện môi trường tại
Trang 4222 24 26 28 30
- Từ bảng phân tích phương sai ANOVA: P =0.1658> 0.05 ở độ tin cậy 95%
giá trị trung bình khác biệt không có ý nghĩa thống kê Thời gian chế biếnkhông ảnh hưởng đến hàm lượng vitamin C
- Xét ở độ tin cậy 95%, hàm lượng vitamin C xử lý trong 15p có giá trị trungbình cao nhất Muốn có hàm lượng vitamin C nhiều nhất cần chọn thời gian 15,
20, 25 hoặc 35p
5.3
1 Yếu tố thí nghiệm là phụ gia thực phẩm
Trang 432 Kết quả thí nghiệm là số liệu về độ cứng của sản phẩm khi sử dụng 4 loại phụgia và lặp lại thí nghiệm 4 lần.
3 Nghiệm thức của thí nghiệm là các giá trị về độ cứng của sản phẩm tương ứngvới mỗi loại phụ gia
4 Có 16 đơn vị thí nghiệm
5 Các yếu tố khác bao gồm quy trình sản xuất, tỷ lệ các nguyên liệu khác, địađiểm sản xuất, thời gian sản xuất, dụng cụ đo, vị trí đo, điều kiện môi trường tạithời điểm đó
6
Table of Least Squares Means for HARDNESS with 95.0 Percent
Confidence Intervals
Stnd Lower Upper Level Count Mean Error Limit Limit
Analysis of Variance for HARDNESS - Type III Sums of Squares
Trang 44P-Squares Square Ratio Value
All F-ratios are based on the residual mean square error
8.Multiple Range Tests for HARDNESS by ADDITIVES
Trang 45Means and 95.0 Percent LSD Intervals
ADDITIVES 93
95 97 99 101
5.4
1 Yếu tố thí nghiệm là tỷ lệ phụ gia
2 Kết quả thí nghiệm là số liệu về độ giòn của sản phẩm khi sử dụng 4 tỷ lệ phụgia khác nhau và lặp lại thí nghiệm 4 lần
3 Nghiệm thức của thí nghiệm là giá trị độ giòn của sản phầm tương ứng vớimỗi tỷ lệ phụ gia
4 Có 16 đơn vị thí nghiệm
Trang 465 Các yếu tố khác bao gồm quy trình sản xuất, tỷ lệ các nguyên liệu khác, địađiểm sản xuất, thời gian sản xuất, dụng cụ đo, vị trí đo, điều kiện môi trường tạithời điểm đó.
6.Table of Least Squares Means for FRACTURABILITY with 95.0 Percent Confidence Intervals
Stnd Lower Upper Level Count Mean Error Limit Limit
All F-ratios are based on the residual mean square error
8.Multiple Range Tests for FRACTURABILITY by ADDITIVES
Method: 95.0 percent LSD
Trang 48Means and 95.0 Percent LSD Intervals
ADDITIVES 9.3
5.5
1 Yếu tố thí nghiệm là nhiệt độ chế biến sản phẩm
2 Kết quả của thí nghiệm là các giá trị độ liên kết của sản phẩm khi nấu ở 4 nhiệt
độ khác nhau và trong 4 lần đo lặp lại
3 Nghiệm thức của thí nghiệm là giá trị độ liên kết tương ứng với mỗi nhiệt độ
4 Có 16 đơn vị thí nghiệm
5 Các yếu tố khác bao gồm quy trình chế biến, nguyên liệu chế biến, thời điểm
đo, máy đo
Trang 496.Table of Least Squares Means for COHESIVENESS with 95.0 Percent Confidence Intervals
Stnd Lower Upper Level Count Mean Error Limit Limit
All F-ratios are based on the residual mean square error
8.Multiple Range Tests for COHESIVENESS by TEMPERATURE
Method: 95.0 percent LSD
TEMPERATU
RE Count LS Mean LS Sigma Homogeneous Groups
Trang 51Means and 95.0 Percent LSD Intervals
TEMPERATURE 7
- Xét ở độ tin cậy 95%, độ liên kết của sản phẩm được chế biến ở nhiệt độ 60℃
có giá trị thấp nhất nhưng lại khong có khác biệt ý nghĩa thống kê với độ liên kếtcủa sản phẩm được chế biến ở các nhiệt độ khác Muốn chọn nhiệt độ giúp độliên kết cao thì 4 nhiệt độ trên đều có thể sử dụng
5.6
1 Yếu tố thí nghiệm là mức năng lượng dùng trong chế biến
2 Kết quả thí nghiệm là độ cứng của sản phẩm trong 4 mức năng lượng khácnhau qua 4 lần đo
3 Nghiệm thức của thí nghiệm là các giá trị độ cứng sản phẩm tương ứng vớimỗi mức năng lượng
4 Có 20 đơn vị thí nghiệm