Các tùy chọn dạng bảng khác trong phân tích này có thể được sử dụng để kiểm tra xem liệu sự khác biệt giữa các thống kê từ hai mẫu có đáng kể hay không.. Giá trị của những thống kê này n
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỐ HỒ CHÍ MINH
KHOA CÔNG NGHỆ THỰC PHẨM
BÀI TẬP MÔN: THỐNG KÊ ỨNG DỤNG VÀ PPTN
GVHD: Nguyễn Anh Trinh
Họ và tên: Đặng Thị Kim Dung
MSSV: 20125363
Lớp: DH20VT
Nhóm môn học: 04_Thứ 2_Ca 4_RD303
Trang 2CHƯƠNG 1: TỔNG QUAN VỀ THỐNG KÊ ỨNG DỤNG
Bài 1: Viết sơ đồ thí nghiệm nghiên cứu chế biến sản phẩm từ nguyên liệu sữa:
VD: Sơ đồ quy trình sản xuất sữa tiệt trùng UTH:
Nguyên liệu: sữa
Trang 3Bài 2: Phân phối mẫu
Trình bày bảng phân phối và vẽ biểu đồ tần số của dữ liệu trong bảng:
Năng suất (kg/mẻ) của 1 loại sản phẩm quan sát tại 32 thời điểm:
Vậy ta có bảng phân phối tần số:
Trang 4CHƯƠNG 2: THÔNG SỐ ĐẶC TRƯNG CỦA MẪU
Bài 3: Tính số ngày dừng bảo dưỡng trung bình của 16 nhà máy chế biến:
Vậy: Số ngày dừng bảo dưỡng trung bình của 16 nhà máy chế biến là khoảng 9 (ngày)
Bài 4: Tính trung bình số sản phẩm đạt tiêu chuẩn trong 60 ngày ở phân xưởng sản xuất:
Sản phẩm đạt tiêu chuẩn kỹ thuật Số ngày
Bài 6: Tính tốc độ tăng trưởng trung bình sản phẩm sản xuất ra trong 3 năm, 2018
so 2017 tăng 13%, 2019 so 2018 tăng 9%, 2020 so 2019 tăng 8%.
Trang 5Bài 7: Mô tả sự biến thiên của 3 nhóm dữ liệu
Trang 6Trung bình 67,1 Trung bình 69,5 Trung bình 67,5
Ph ươ ng sai 4,77 272,28 566,50
CHƯƠNG 3: PHÂN PHỐI DỮ LIỆU TRONG THỐNG KÊ
Bài 8: Vẽ biểu đồ phân phối chuẩn của trọng lượng mỗi sản phẩm ghi được trong quá trình sản xuất như sau:
Trang 7Để nhóm cuối phủ tất cả các quan sát chọn khoảng cách bằng 6 và
nhóm bắt đầu bằng trị số 145, ta có các nhóm như sau: 145-151,
Bài 9: Dùng kiểm định Khi-Bình phương để so sánh 4 qui trình chế biến sản phẩm
A, B, C, D với kết quả như sau:
Trang 838(157169)/596 =44,52
35(157120)/596 =31,61
56(157159)/596 =41,88
124,48
85(439120)/596 =88,39
103(439159)/596 =117,12
C(70,83%), D(64,78%) khác biệt có ý nghĩa thống kê với p < 0.01
Trang 9CHƯƠNG 4: PHƯƠNG PHÁP SO SÁNH MẪU ĐƠN GIẢN
Bài 10: Dùng kiểm định t để so sánh mức độ sai khác của trung bình tỷ lệ chất thu hồi giữa chất A và B như sau:
Trang 10Vậy kết luận 2 số trung bình khác nhau có ý nghĩa p≤ 0,01
Bài 11: Dùng kiểm định t để so sánh pH của 2 mẫu nước được xử lý từ 2 chế độ:
6,456,326,096,296,616,886,996,786,98
6,626,316,166,226,636,766,656,566,43
Đặt giả thuyết Ho: Khác biệt giữa trung bình pH của mẫu nước A với pH của mẫu nước B không có ý nghĩa thống kê ở độ tin cậy 99%
Trang 11Bậc tự do(df)
SSe = (2537–2236,67)2 + (2069-2236,67)2 + (2104-2236,67)2 + (3366-2722,67)2 +(2591-2722,67)2 + (2211-2722,67)2 + (2536-2606)2 + (2459-2606)2 + (2823-2606)2 =902527,33
SSnt = SST – SSe = 382488,95
Tra bảng Fisher, với 2, bậc tự do ở tử và 6, bậc tự do ở mẫu, được:
F0,05 = 5,14
Với Ftính < Fbảng -> Không có ý nghĩa thống kê
12B: Kết quả thí nghiệm độ chắc của sản phẩm được xử lý từ 3 chất phụ gia:
Trang 12SSe = (1.37 – 1.3733)2 + (1.34 – 1.3733)2 + (1.41 – 1.3733)2 + (1.44 – 1.3733)2 + (1.45– 1.3733)2 + (1.49 – 1.3733)2 + (1.51 – 1.3733)2 +(1.58 – 1.3733)2 + (1.53 – 1.3733)2
Bậc tự do(df)
Trang 13Bậc tự do(df)
Phương sai (MS) F
Trang 15Nhận xét:
Bảng này hiển thị thống kê tóm tắt cho hai mẫu dữ liệu Các tùy chọn dạng bảng khác trong phân tích này có thể được sử dụng để kiểm tra xem liệu sự khác biệt giữa các thống kê từ hai mẫu có đáng kể hay không Mối quan tâm đặc biệt ở đây là độ lệch tiêu chuẩn hóa và độ lệch tiêu chuẩn hóa, có thể được sử dụng để xác định xem các mẫu có đến từ các phân bố bình thường hay không Giá trị của những thống kê này nằm ngoài phạm vi từ -2 đến +2 cho thấy sự khác biệt đáng kể so với tiêu chuẩn, điều này sẽ có xu hướng làm mất hiệu lực của các thử nghiệm so sánh độ lệch chuẩn Trong trường hợp này, cả hai giá trị độ lệch chuẩn đều nằm trong phạm vi dự kiến Cảhai giá trị kurtosis được chuẩn hóa đều nằm trong phạm vi dự kiến
2 So sánh trung bình của 2 mẫu A và B, nhận xét:
- Khoảng tin cậy 95,0% cho giá trị trung bình của A: 16,9571 +/- 1,4455 [15,5116, 18,4026]
- Khoảng tin cậy 95,0% cho giá trị trung bình của B: 19.5286 +/- 1.19483 [18.3337, 20.7234]
- Khoảng tin cậy 95,0% cho sự khác biệt giữa các phương tiện giả sử các phương sai bằng nhau: -2,57143 +/- 1,66991 [-4,24134, -0,901517]
Nhận xét: ta thấy P-value = 0.00572615 < alpha = 0.05 => bác bỏ giả thiết(NUOCXOAIA ≠ NUOCXOAIB) các giá trị trung bình khác biệt có ý nghĩa thống kê
3 Biểu diễn biểu đồ phân bố tần suất, nhận xét:
Nhận xét:
- Nước xoài A:
14,8 < A< 16 có 2 lần xuất hiện
16<A<18 có 3 lần xuất hiện
18<A<20 có 2 lần xuất hiện
Trang 16- Nước xoài B:
16<B<18 có 1 lần xuất hiện
18<B< 20 có 3 lần xuất hiện
20<B<22 có 3 lần xuất hiện
Độ brix của xoài B cao hơn xoài A
Biểu diễn biểu đồ hộp, nhận xét:
Trang 17ở đây là độ lệch chuẩn và độ lệch chuẩn, có thể được sử dụng để xác định xem các mẫu có đến từ các phân bố bình thường hay không Giá trị của những thống kê này nằm ngoài phạm vi từ -2 đến +2 cho thấy sự khác biệt đáng kể so với tiêu chuẩn, điều này sẽ có xu hướng làm mất hiệu lực của các thử nghiệm so sánh độ lệch chuẩn Trong trường hợp này, cả hai giá trị độ lệch chuẩn đều nằm trong phạm vi dự kiến Cảhai giá trị kurtosis được chuẩn hóa đều nằm trong phạm vi dự kiến.
2 So sánh trung bình của 2 mẫu A và B, nhận xét:
Khoảng tin cậy 95,0% cho giá trị trung bình của Col_1:
6,72167 +/- 0,141018 [6,58065, 6,86269]
Khoảng tin cậy 95,0% cho giá trị trung bình của Col_2:
6.44833 +/- 0.479005 [5.96933, 6.92734]
Khoảng tin cậy 95,0% cho sự khác biệt giữa các phương tiện
giả sử các phương sai bằng nhau: 0,273333 +/- 0,432812 [-0.159479, 0,706145]
t = 1.40714 P-value = 0.189699> 0.05
Trang 18 2 giá trị trung bình của 2 mẫu nguồn A nguồn B là khác biệt không có ý nghĩa thống kê ở độ tin cậy 95%
3 Biểu diễn biểu đồ phân bố tần suất, nhận xét:
A
B 4
2 0 2 4
6.5<A<6.8 có 4 lần xuất hiện
6.8<A<7.1 có 2 lần xuất hiện
Trang 195 Kết luận của thí nghiệm:
Vì sự khác biệt giữa 2 nguồn không có ý nghĩa thống kê nên chọn nguồn A hay B đều được
Bài 15: Kết quả thí nghiệm vi sinh vật của sản phẩm được xử lí từ 2 chế độ
Lặp lại Không xử lý nhiệt Xử lý nhiệt
Trang 20XULYNHIE T
độ lệch chuẩn và độ lệch chuẩn, có thể được sử dụng để xác định xem các mẫu có đến
từ các phân bố bình thường hay không Giá trị của những thống kê này nằm ngoài phạm vi từ -2 đến +2 cho thấy sự khác biệt đáng kể so với tiêu chuẩn, điều này sẽ có
xu hướng làm mất hiệu lực của các thử nghiệm so sánh độ lệch chuẩn Trong trường hợp này, cả hai giá trị độ lệch chuẩn đều nằm trong phạm vi dự kiến Cả hai giá trị kurtosis được chuẩn hóa đều nằm trong phạm vi dự kiến
Trang 21Khoảng tin cậy 95,0% cho giá trị trung bình của KHONGXULYNHIET: 3,27143 +/- 1,64467 [1,62675, 4,9161]
Khoảng tin cậy 95,0% cho giá trị trung bình của XULYNHIET: 2,91286 +/- 1,26126 [1,65159, 4,17412]
Khoảng tin cậy 95,0% cho sự khác biệt giữa các phương tiện giả sử các phương sai bằng nhau: 0,358571 +/- 1,84553 [-1,48696, 2,2041]
2 0 2 4
0< Không xử lý nhiệt<1.23 có 1 lần xuất hiện
1.23< Không xử lý nhiệt<2.5 có 1 lần xuất hiện
2.5< Không xử lý nhiệt<3.8 có 1 lần xuất hiện
3.8< Không xử lý nhiệt<5 có 4 lần xuất hiện
Xử lý nhiệt:
0 < xử lý nhiệt <1.23 có 1 lần xuất hiện
1.23 < xử lý nhiệt <2.5 có 1 lần xuất hiện
2.5 < xử lý nhiệt <3.8 có 3 lần xuất hiện
3.8 < xử lý nhiệt <5 có 2 lần xuất hiện
4.Biếu diễn biểu đồ hộp , nhận xét?
Trang 225.Kết luận của thí nghiệm
Vì sự khác biệt giữa 2 quá trình xử lí và không xử lí không có ý nghĩa thống kê nên chọn quá trình nào cũng đều được
Bài 16: Kết quả thí nghiệm lượng glycogen của sản phẩm được xử lí từ 2 chế độ
Trang 23Nhận xét: Bảng này hiển thị thống kê tóm tắt cho hai mẫu dữ liệu Các tùy chọn dạng
bảng khác trong phân tích này có thể được sử dụng để kiểm tra xem sự khác biệt giữa các số liệu thống kê từ hai mẫu có ý nghĩa thống kê hay không Mối quan tâm đặc biệt
ở đây là độ lệch chuẩn và độ lệch chuẩn, có thể được sử dụng để xác định xem các mẫu có đến từ các phân bố bình thường hay không Giá trị của những thống kê này nằm ngoài phạm vi từ -2 đến +2 cho thấy sự khác biệt đáng kể so với tiêu chuẩn, điều này sẽ có xu hướng làm mất hiệu lực của các thử nghiệm so sánh độ lệch chuẩn Trong trường hợp này, cả hai giá trị độ lệch chuẩn đều nằm trong phạm vi dự kiến Cảhai giá trị kurtosis được chuẩn hóa đều nằm trong phạm vi dự kiến
2.So sánh trung bình của 2 mẫu A và B, nhận xét?
95.0% confidence interval for mean of NAUTHUONG: 25.2857 +/- 5.41159
[19.8741, 30.6973]
95.0% confidence interval for mean of VIBA: 15.5714 +/- 6.60165 [8.96978,
22.1731]
95.0% confidence interval for the difference between the means
assuming equal variances: 9.71429 +/- 7.60094 [2.11334, 17.3152]
: t = 2.78461 P-value = 0.0165087 <0.05
2 giá trị trung bình của 2 mẫu nấu thường và viba là khác biệt có ý nghĩa thống
kê ở độ tin cậy 95%
Trang 243.Biểu diễn biểu đồ phân bố tần suất, nhận xét ?
NAUTHUONG
VIBA 5
3 1 1 3 5
10< nấu thường<20 có 1 lần xuất hiện
20<nấu thường<30 có 5 lần xuất hiện
30<nấu thường<40 có 1 lần xuất hiện
Vi ba
0<vi ba<10 có 2 lần xuất hiện
10<vi ba<20 có 2 lần xuất hiện
20<vi ba<30 có 3 lần xuất hiện
4 Biếu diễn biểu đồ hộp, nhận xét?
Trang 251.So sánh trung bình của 2 mẫu A và B, nhận xét?
Khoảng tin cậy 95,0% cho giá trị trung bình của A: 2,8 +/- 1,03885 [1,76115, 3,83885]
Khoảng tin cậy 95,0% cho giá trị trung bình của B: 3,2 +/- 1,03885 [2,16115, 4,23885]
Trang 26Khoảng tin cậy 95,0% cho sự khác biệt giữa các phương tiện
giả sử các phương sai bằng nhau: -0,4 +/- 1,22023 [-1,62023, 0,820226]
t = -0.755929 P-value = 0.471362 >0.05
2 giá trị trung bình của 2 dung dịch A và B là khác biệt không có ý nghĩa thống
kê ở độ tin cậy 95%
2 Biểu diễn biểu đồ phân bố tần suất, nhận xét ?
A
B 2
1.9<A<2.5 có tần số xuất hiện là 2 lần
2.5<A<3.1 có tần số xuất hiện là 2 lần
3.7<A<4.3 có tần số xuất hiện là 1 lần
Dung dịch B
1.9<A<2.5 có tần số xuất hiện là 1 lần
2.5<A<3.1 có tần số xuất hiện là 2 lần
3.7<A<4.3 có tần số xuất hiện là 2 lần
3.Biếu diễn biểu đồ hộp, nhận xét?
Trang 282 Kết quả thí nghiệm: định mức sơ chế của kích cỡ cá
3 Nghiệm thức của thí nghiệm là: 3
Coeff of variation
Minimu m
Maximu m
Rang e
Stnd skewness
Nhận xét: Bảng này hiển thị các số liệu thống kê khác nhau về DINHMUC cho từng
cấp độ trong 3 cấp độ của KICHCOCA Phân tích phương sai một chiều chủ yếu
nhằm so sánh giá trị trung bình của các cấp độ khác nhau, được liệt kê ở đây trong cột
Trung bình Chọn Lô phương tiện từ danh sách Tùy chọn đồ họa để hiển thị phương
tiện bằng đồ thị
7 Bảng kết quả phân tích phương sai, nhận xét?
Source Sum of Squares Df Mean Square
F-Ratio P-Value
Nhận xét: Bảng ANOVA phân tích phương sai của DINHMUC thành hai thành phần:
thành phần giữa nhóm và thành phần bên trong nhóm Tỷ lệ F, trong trường hợp này
bằng 9.21212, là tỷ lệ giữa ước tính giữa nhóm với ước tính trong nhóm Vì giá trị P
của phép thử F nhỏ hơn 0,05, nên có sự khác biệt có ý nghĩa thống kê giữa
DINHMUC trung bình từ một mức KICHCOCA khác ở mức độ tin cậy 95,0% Để
xác định phương tiện nào khác biệt đáng kể so với những phương tiện khác, hãy chọn
Kiểm tra nhiều phạm vi từ danh sách Tùy chọn bảng
Trang 298 So sánh các trung bình bằng trắc nghiệm LSD (nếu có), nhận xét?
Nhận xét: các giá trị của KICHCOCA khác biệt không có ý nghĩa thống kê
9 Biểu diễn biểu đồ mean plot, nhận xét?
Means and 95.0 Percent LSD Intervals
KICHCOCA 1.4
Trang 30Lặp lại (n) Thời gian nấu (phút)
1 Yếu tố thí nghiệm là thời gian nấu
2 Kết quả thí nghiệm là lượng vitamin C
3 Nghiệm thức của thí nghiệm là 5
Avera ge
Standard deviation
Coeff of variation
Minim um
Maxim um
Ran ge
Stnd skewness
Trang 31Bảng này hiển thị các số liệu thống kê khác nhau về DINHMUC cho mỗi cấp độ trong số 4 cấp độ của THOIGIANNAU Phân tích phương sai một chiều chủ yếu nhằm so sánh giá trị trung bình của các cấp độ khác nhau, được liệt kê ở đây trong cột Trung bình Chọn Lô phương tiện từ danh sách Tùy chọn đồ họa để hiển thị phương tiện bằng đồ thị.
7 Bảng kết quả phân tích phương sai, nhận xét?
ANOVA Table for DINHMUC by THOIGIANNAU
Source Sum of
Squares
Df Mean Square
Trang 329.Biểu diễn biểu đồ mean plot, nhận xét?
Means and 95.0 Percent LSD Intervals
THOIGIANNAU 20
22 24 26 28 30
cao
Trang 33Bài 20: Kết quả thí nghiệm độ chắc của sản phẩm được xử lí từ 6 hàm lượng khác
1.Yếu tố thí nghiệm là hàm lượng gelatin
2.Kết quả thí nghiệm là độ chắc ở các mức hàm lượng gelatin
3.Nghiệm thức của thí nghiệm là 5
4.Số đơn vị thí nghiệm là 25
5.Các yếu tố khác cần phải giữ như nhau ở mỗi ĐVTN là cùng một loại gelatin,cùng
dụng cụ, cùng thời gian, cùng người thực hiện, cùng thao tác
6.Xác định các đại lượng thống kê, nhận xét?
Summary Statistics for DINHMUC
Coeff of variation
Minimu m
Maximu m
Rang e
Trang 347.Bảng kết quả phân tích phương sai, nhận xét?
ANOVA Table for DINHMUC by HAMLUONGGELATIN
Source Sum of
Squares
Df Mean Square
Để xác định phương tiện nào khác biệt đáng kể so với những phương tiện khác, hãy chọn Kiểm tra Nhiều Phạm vi từ danh sách Tùy chọn Bảng
8.So sánh các trung bình bằng trắc nghiệm LSD ( nếu có) , nhận xét?
Multiple Range Tests for DINHMUC by HAMLUONGGELATIN
Method: 95.0 percent LSD
Trang 36khác biệt có ý nghĩa thống kê Phương pháp hiện đang được sử dụng để phân biệt giữacác phương tiện là thủ tục có sự khác biệt nhỏ nhất có ý nghĩa (LSD) của Fisher Với phương pháp này, có 5,0% rủi ro khi gọi mỗi cặp phương tiện là khác nhau đáng kể khi chênh lệch thực tế bằng 0.
9.Biểu diễn biểu đồ mean plot, nhận xét?
Means and 95.0 Percent LSD Intervals
HAMLUONGGELATIN 190
Nhận xét: không có giá trị nào trùng nhau
10.Viết báo cáo kết quả và kết luận của thí nghiệm? (chọn hàm lượng gelatin nào, tiêuchí: độ chắc cao nhất): Chọn hàm lượng gelatin 40g/l vì ở đây có độ chắc cao nhất
Bài 21: Trong thí nghiệm khỏa sát định mức sơ chế của 3 cỡ cá khác nhau
- Kiểu bố trí thí nghiệm: thí nghiệm bố trí theo kiểu hoàn toàn ngẫu nhiên 1 yếu tố
- Yếu tố thí nghiệm: kích cỡ cá
- Số mức độ của yếu tố: 5 mức độ
Trang 37- Số lần lặp lại trong nghiệm thức: 5 lần.
- Số đơn vị thí nghiệm: 25 đơn vị
- Chỉ tiêu theo dõi: định mức sơ chế của cá
- Yếu tố khác: được giữ như nhau ở mỗi đơn vị thí nghiệm là: 1 loại cá, 1 chất lượng cá, 1 cái cân, 1 người làm, 1 cách làm
Bậc tự doDf
Mean Square
Trang 38- Số lần lặp lại trong nghiệm thức: 5 lần
- Số đơn vị thí nghiệm: 25 đơn vị
- Chỉ tiêu theo dõi: thời gian bảo quản
- Yếu tố khác: được giữ như nhau ở mỗi đơn vị thí nghiệm là: 1 loại sản phẩm,
1 thời gian, dụng cụ đo lường, 1 cách làm, 1 nhiệt độ
Trang 39thiên độ lệch
bình phương
đo ở 4 vị trí khác nhau trên sản phẩm:
1 Yếu tố chính của thí nghiệm là chất phụ gia
Yếu tố ngoại cảnh của thí nghiệm là vị trí đo
2 Chỉ tiêu theo dõi của thí nghiệm là độ cứng của sản phẩm
3 Nghiệm thức của thí nghiệm là A,B,C,D
4 Số đơn vị thí nghiệm là 16
5 Các yếu tố khác cần phải giữ như nhau ở mỗi đơn vị thí nghiệm là cùng một quy trình, thông số kỹ thuật, bề dày sản phẩm như nhau, cùng một dụng cụ đo, cùng ngườithực hiện,…
6 Xác định các đại lượng thống kê, nhận xét
Trang 40Ratio
Homogeneous Groups
Trang 41* denotes a statistically significant difference.
Nhận xét: Bảng này áp dụng quy trình so sánh nhiều lần để xác định phương tiện nào
khác biệt đáng kể so với phương tiện khác Nửa dưới của kết quả hiển thị sự khác biệtước tính giữa mỗi cặp phương tiện Một dấu hoa thị đã được đặt bên cạnh 3 cặp, cho thấy rằng các cặp này cho thấy sự khác biệt có ý nghĩa thống kê ở mức độ tin cậy 95,0% Ở đầu trang, 2 nhóm đồng nhất được xác định bằng cách sử dụng các cột của
X Trong mỗi cột, các cấp độ chứa X tạo thành một nhóm các phương tiện mà trong
đó không có sự khác biệt có ý nghĩa thống kê Phương pháp hiện đang được sử dụng
để phân biệt giữa các phương tiện là thủ tục có sự khác biệt nhỏ nhất có ý nghĩa (LSD) của Fisher Với phương pháp này, có 5,0% rủi ro khi gọi mỗi cặp phương tiện
là khác nhau đáng kể khi chênh lệch thực tế bằng 0
9 Biểu diễn biểu đồ mean plot