bài tập thống kê ứng dụng và pptn

Các tùy chọn dạng bảng khác trong phân tích này có thể được sử dụng để kiểm tra xem liệu sự khác biệt giữa các thống kê từ hai mẫu có đáng kể hay không.. Giá trị của những thống kê này n

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỐ HỒ CHÍ MINH

KHOA CÔNG NGHỆ THỰC PHẨM



BÀI TẬP MÔN: THỐNG KÊ ỨNG DỤNG VÀ PPTN

GVHD: Nguyễn Anh Trinh

Họ và tên: Đặng Thị Kim Dung

MSSV: 20125363

Lớp: DH20VT

Nhóm môn học: 04_Thứ 2_Ca 4_RD303

Trang 2

CHƯƠNG 1: TỔNG QUAN VỀ THỐNG KÊ ỨNG DỤNG

Bài 1: Viết sơ đồ thí nghiệm nghiên cứu chế biến sản phẩm từ nguyên liệu sữa:

VD: Sơ đồ quy trình sản xuất sữa tiệt trùng UTH:

Nguyên liệu: sữa

Trang 3

Bài 2: Phân phối mẫu

Trình bày bảng phân phối và vẽ biểu đồ tần số của dữ liệu trong bảng:

Năng suất (kg/mẻ) của 1 loại sản phẩm quan sát tại 32 thời điểm:

Vậy ta có bảng phân phối tần số:

Trang 4

CHƯƠNG 2: THÔNG SỐ ĐẶC TRƯNG CỦA MẪU

Bài 3: Tính số ngày dừng bảo dưỡng trung bình của 16 nhà máy chế biến:

Vậy: Số ngày dừng bảo dưỡng trung bình của 16 nhà máy chế biến là khoảng 9 (ngày)

Bài 4: Tính trung bình số sản phẩm đạt tiêu chuẩn trong 60 ngày ở phân xưởng sản xuất:

Sản phẩm đạt tiêu chuẩn kỹ thuật Số ngày

Bài 6: Tính tốc độ tăng trưởng trung bình sản phẩm sản xuất ra trong 3 năm, 2018

so 2017 tăng 13%, 2019 so 2018 tăng 9%, 2020 so 2019 tăng 8%.

Trang 5

Bài 7: Mô tả sự biến thiên của 3 nhóm dữ liệu

Trang 6

Trung bình 67,1 Trung bình 69,5 Trung bình 67,5

Ph ươ ng sai 4,77 272,28 566,50

CHƯƠNG 3: PHÂN PHỐI DỮ LIỆU TRONG THỐNG KÊ

Bài 8: Vẽ biểu đồ phân phối chuẩn của trọng lượng mỗi sản phẩm ghi được trong quá trình sản xuất như sau:

Trang 7

Để nhóm cuối phủ tất cả các quan sát chọn khoảng cách bằng 6 và

nhóm bắt đầu bằng trị số 145, ta có các nhóm như sau: 145-151,

Bài 9: Dùng kiểm định Khi-Bình phương để so sánh 4 qui trình chế biến sản phẩm

A, B, C, D với kết quả như sau:

Trang 8

38(157169)/596 =44,52

35(157120)/596 =31,61

56(157159)/596 =41,88

124,48

85(439120)/596 =88,39

103(439159)/596 =117,12

C(70,83%), D(64,78%) khác biệt có ý nghĩa thống kê với p < 0.01

Trang 9

CHƯƠNG 4: PHƯƠNG PHÁP SO SÁNH MẪU ĐƠN GIẢN

Bài 10: Dùng kiểm định t để so sánh mức độ sai khác của trung bình tỷ lệ chất thu hồi giữa chất A và B như sau:

Trang 10

Vậy kết luận 2 số trung bình khác nhau có ý nghĩa p≤ 0,01

Bài 11: Dùng kiểm định t để so sánh pH của 2 mẫu nước được xử lý từ 2 chế độ:

6,456,326,096,296,616,886,996,786,98

6,626,316,166,226,636,766,656,566,43

Đặt giả thuyết Ho: Khác biệt giữa trung bình pH của mẫu nước A với pH của mẫu nước B không có ý nghĩa thống kê ở độ tin cậy 99%

Trang 11

Bậc tự do(df)

SSe = (2537–2236,67)2 + (2069-2236,67)2 + (2104-2236,67)2 + (3366-2722,67)2 +(2591-2722,67)2 + (2211-2722,67)2 + (2536-2606)2 + (2459-2606)2 + (2823-2606)2 =902527,33

SSnt = SST – SSe = 382488,95

Tra bảng Fisher, với 2, bậc tự do ở tử và 6, bậc tự do ở mẫu, được:

F0,05 = 5,14

Với Ftính < Fbảng -> Không có ý nghĩa thống kê

12B: Kết quả thí nghiệm độ chắc của sản phẩm được xử lý từ 3 chất phụ gia:

Trang 12

SSe = (1.37 – 1.3733)2 + (1.34 – 1.3733)2 + (1.41 – 1.3733)2 + (1.44 – 1.3733)2 + (1.45– 1.3733)2 + (1.49 – 1.3733)2 + (1.51 – 1.3733)2 +(1.58 – 1.3733)2 + (1.53 – 1.3733)2

Bậc tự do(df)

Trang 13

Bậc tự do(df)

Phương sai (MS) F

Trang 15

Nhận xét:

Bảng này hiển thị thống kê tóm tắt cho hai mẫu dữ liệu Các tùy chọn dạng bảng khác trong phân tích này có thể được sử dụng để kiểm tra xem liệu sự khác biệt giữa các thống kê từ hai mẫu có đáng kể hay không Mối quan tâm đặc biệt ở đây là độ lệch tiêu chuẩn hóa và độ lệch tiêu chuẩn hóa, có thể được sử dụng để xác định xem các mẫu có đến từ các phân bố bình thường hay không Giá trị của những thống kê này nằm ngoài phạm vi từ -2 đến +2 cho thấy sự khác biệt đáng kể so với tiêu chuẩn, điều này sẽ có xu hướng làm mất hiệu lực của các thử nghiệm so sánh độ lệch chuẩn Trong trường hợp này, cả hai giá trị độ lệch chuẩn đều nằm trong phạm vi dự kiến Cảhai giá trị kurtosis được chuẩn hóa đều nằm trong phạm vi dự kiến

2 So sánh trung bình của 2 mẫu A và B, nhận xét:

- Khoảng tin cậy 95,0% cho giá trị trung bình của A: 16,9571 +/- 1,4455 [15,5116, 18,4026]

- Khoảng tin cậy 95,0% cho giá trị trung bình của B: 19.5286 +/- 1.19483 [18.3337, 20.7234]

- Khoảng tin cậy 95,0% cho sự khác biệt giữa các phương tiện giả sử các phương sai bằng nhau: -2,57143 +/- 1,66991 [-4,24134, -0,901517]

Nhận xét: ta thấy P-value = 0.00572615 < alpha = 0.05 => bác bỏ giả thiết(NUOCXOAIA ≠ NUOCXOAIB) các giá trị trung bình khác biệt có ý nghĩa thống kê

3 Biểu diễn biểu đồ phân bố tần suất, nhận xét:

Nhận xét:

- Nước xoài A:

14,8 < A< 16 có 2 lần xuất hiện

16<A<18 có 3 lần xuất hiện

18<A<20 có 2 lần xuất hiện

Trang 16

- Nước xoài B:

16<B<18 có 1 lần xuất hiện

18<B< 20 có 3 lần xuất hiện

20<B<22 có 3 lần xuất hiện

 Độ brix của xoài B cao hơn xoài A

Biểu diễn biểu đồ hộp, nhận xét:

Trang 17

ở đây là độ lệch chuẩn và độ lệch chuẩn, có thể được sử dụng để xác định xem các mẫu có đến từ các phân bố bình thường hay không Giá trị của những thống kê này nằm ngoài phạm vi từ -2 đến +2 cho thấy sự khác biệt đáng kể so với tiêu chuẩn, điều này sẽ có xu hướng làm mất hiệu lực của các thử nghiệm so sánh độ lệch chuẩn Trong trường hợp này, cả hai giá trị độ lệch chuẩn đều nằm trong phạm vi dự kiến Cảhai giá trị kurtosis được chuẩn hóa đều nằm trong phạm vi dự kiến.

2 So sánh trung bình của 2 mẫu A và B, nhận xét:

Khoảng tin cậy 95,0% cho giá trị trung bình của Col_1:

6,72167 +/- 0,141018 [6,58065, 6,86269]

Khoảng tin cậy 95,0% cho giá trị trung bình của Col_2:

6.44833 +/- 0.479005 [5.96933, 6.92734]

Khoảng tin cậy 95,0% cho sự khác biệt giữa các phương tiện

giả sử các phương sai bằng nhau: 0,273333 +/- 0,432812 [-0.159479, 0,706145]

t = 1.40714 P-value = 0.189699> 0.05

Trang 18

 2 giá trị trung bình của 2 mẫu nguồn A nguồn B là khác biệt không có ý nghĩa thống kê ở độ tin cậy 95%

3 Biểu diễn biểu đồ phân bố tần suất, nhận xét:

A

B 4

2 0 2 4

6.5<A<6.8 có 4 lần xuất hiện

6.8<A<7.1 có 2 lần xuất hiện

Trang 19

5 Kết luận của thí nghiệm:

Vì sự khác biệt giữa 2 nguồn không có ý nghĩa thống kê nên chọn nguồn A hay B đều được

Bài 15: Kết quả thí nghiệm vi sinh vật của sản phẩm được xử lí từ 2 chế độ

Lặp lại Không xử lý nhiệt Xử lý nhiệt

Trang 20

XULYNHIE T

độ lệch chuẩn và độ lệch chuẩn, có thể được sử dụng để xác định xem các mẫu có đến

từ các phân bố bình thường hay không Giá trị của những thống kê này nằm ngoài phạm vi từ -2 đến +2 cho thấy sự khác biệt đáng kể so với tiêu chuẩn, điều này sẽ có

xu hướng làm mất hiệu lực của các thử nghiệm so sánh độ lệch chuẩn Trong trường hợp này, cả hai giá trị độ lệch chuẩn đều nằm trong phạm vi dự kiến Cả hai giá trị kurtosis được chuẩn hóa đều nằm trong phạm vi dự kiến

Trang 21

Khoảng tin cậy 95,0% cho giá trị trung bình của KHONGXULYNHIET: 3,27143 +/- 1,64467 [1,62675, 4,9161]

Khoảng tin cậy 95,0% cho giá trị trung bình của XULYNHIET: 2,91286 +/- 1,26126 [1,65159, 4,17412]

Khoảng tin cậy 95,0% cho sự khác biệt giữa các phương tiện giả sử các phương sai bằng nhau: 0,358571 +/- 1,84553 [-1,48696, 2,2041]

2 0 2 4

0< Không xử lý nhiệt<1.23 có 1 lần xuất hiện

1.23< Không xử lý nhiệt<2.5 có 1 lần xuất hiện

2.5< Không xử lý nhiệt<3.8 có 1 lần xuất hiện

3.8< Không xử lý nhiệt<5 có 4 lần xuất hiện

Xử lý nhiệt:

0 < xử lý nhiệt <1.23 có 1 lần xuất hiện

1.23 < xử lý nhiệt <2.5 có 1 lần xuất hiện

2.5 < xử lý nhiệt <3.8 có 3 lần xuất hiện

3.8 < xử lý nhiệt <5 có 2 lần xuất hiện

4.Biếu diễn biểu đồ hộp , nhận xét?

Trang 22

5.Kết luận của thí nghiệm

Vì sự khác biệt giữa 2 quá trình xử lí và không xử lí không có ý nghĩa thống kê nên chọn quá trình nào cũng đều được

Bài 16: Kết quả thí nghiệm lượng glycogen của sản phẩm được xử lí từ 2 chế độ

Trang 23

Nhận xét: Bảng này hiển thị thống kê tóm tắt cho hai mẫu dữ liệu Các tùy chọn dạng

bảng khác trong phân tích này có thể được sử dụng để kiểm tra xem sự khác biệt giữa các số liệu thống kê từ hai mẫu có ý nghĩa thống kê hay không Mối quan tâm đặc biệt

ở đây là độ lệch chuẩn và độ lệch chuẩn, có thể được sử dụng để xác định xem các mẫu có đến từ các phân bố bình thường hay không Giá trị của những thống kê này nằm ngoài phạm vi từ -2 đến +2 cho thấy sự khác biệt đáng kể so với tiêu chuẩn, điều này sẽ có xu hướng làm mất hiệu lực của các thử nghiệm so sánh độ lệch chuẩn Trong trường hợp này, cả hai giá trị độ lệch chuẩn đều nằm trong phạm vi dự kiến Cảhai giá trị kurtosis được chuẩn hóa đều nằm trong phạm vi dự kiến

2.So sánh trung bình của 2 mẫu A và B, nhận xét?

95.0% confidence interval for mean of NAUTHUONG: 25.2857 +/- 5.41159

[19.8741, 30.6973]

95.0% confidence interval for mean of VIBA: 15.5714 +/- 6.60165 [8.96978,

22.1731]

95.0% confidence interval for the difference between the means

assuming equal variances: 9.71429 +/- 7.60094 [2.11334, 17.3152]

: t = 2.78461 P-value = 0.0165087 <0.05

 2 giá trị trung bình của 2 mẫu nấu thường và viba là khác biệt có ý nghĩa thống

kê ở độ tin cậy 95%

Trang 24

3.Biểu diễn biểu đồ phân bố tần suất, nhận xét ?

NAUTHUONG

VIBA 5

3 1 1 3 5

10< nấu thường<20 có 1 lần xuất hiện

20<nấu thường<30 có 5 lần xuất hiện

30<nấu thường<40 có 1 lần xuất hiện

Vi ba

0<vi ba<10 có 2 lần xuất hiện

4 Biếu diễn biểu đồ hộp, nhận xét?

Trang 25

1.So sánh trung bình của 2 mẫu A và B, nhận xét?

Khoảng tin cậy 95,0% cho giá trị trung bình của A: 2,8 +/- 1,03885 [1,76115, 3,83885]

Khoảng tin cậy 95,0% cho giá trị trung bình của B: 3,2 +/- 1,03885 [2,16115, 4,23885]

Trang 26

Khoảng tin cậy 95,0% cho sự khác biệt giữa các phương tiện

giả sử các phương sai bằng nhau: -0,4 +/- 1,22023 [-1,62023, 0,820226]

t = -0.755929 P-value = 0.471362 >0.05

 2 giá trị trung bình của 2 dung dịch A và B là khác biệt không có ý nghĩa thống

kê ở độ tin cậy 95%

2 Biểu diễn biểu đồ phân bố tần suất, nhận xét ?

A

B 2

1.9<A<2.5 có tần số xuất hiện là 2 lần

Dung dịch B

3.Biếu diễn biểu đồ hộp, nhận xét?

Trang 28

2 Kết quả thí nghiệm: định mức sơ chế của kích cỡ cá

3 Nghiệm thức của thí nghiệm là: 3

Coeff of variation

Minimu m

Maximu m

Rang e

Stnd skewness

Nhận xét: Bảng này hiển thị các số liệu thống kê khác nhau về DINHMUC cho từng

cấp độ trong 3 cấp độ của KICHCOCA Phân tích phương sai một chiều chủ yếu

nhằm so sánh giá trị trung bình của các cấp độ khác nhau, được liệt kê ở đây trong cột

Trung bình Chọn Lô phương tiện từ danh sách Tùy chọn đồ họa để hiển thị phương

tiện bằng đồ thị

7 Bảng kết quả phân tích phương sai, nhận xét?

Source Sum of Squares Df Mean Square

F-Ratio P-Value

Nhận xét: Bảng ANOVA phân tích phương sai của DINHMUC thành hai thành phần:

thành phần giữa nhóm và thành phần bên trong nhóm Tỷ lệ F, trong trường hợp này

bằng 9.21212, là tỷ lệ giữa ước tính giữa nhóm với ước tính trong nhóm Vì giá trị P

của phép thử F nhỏ hơn 0,05, nên có sự khác biệt có ý nghĩa thống kê giữa

DINHMUC trung bình từ một mức KICHCOCA khác ở mức độ tin cậy 95,0% Để

xác định phương tiện nào khác biệt đáng kể so với những phương tiện khác, hãy chọn

Kiểm tra nhiều phạm vi từ danh sách Tùy chọn bảng

Trang 29

8 So sánh các trung bình bằng trắc nghiệm LSD (nếu có), nhận xét?

Nhận xét: các giá trị của KICHCOCA khác biệt không có ý nghĩa thống kê

9 Biểu diễn biểu đồ mean plot, nhận xét?

Means and 95.0 Percent LSD Intervals

KICHCOCA 1.4

Trang 30

Lặp lại (n) Thời gian nấu (phút)

1 Yếu tố thí nghiệm là thời gian nấu

2 Kết quả thí nghiệm là lượng vitamin C

3 Nghiệm thức của thí nghiệm là 5

Avera ge

Standard deviation

Minim um

Maxim um

Ran ge

Stnd skewness

Trang 31

Bảng này hiển thị các số liệu thống kê khác nhau về DINHMUC cho mỗi cấp độ trong số 4 cấp độ của THOIGIANNAU Phân tích phương sai một chiều chủ yếu nhằm so sánh giá trị trung bình của các cấp độ khác nhau, được liệt kê ở đây trong cột Trung bình Chọn Lô phương tiện từ danh sách Tùy chọn đồ họa để hiển thị phương tiện bằng đồ thị.

7 Bảng kết quả phân tích phương sai, nhận xét?

ANOVA Table for DINHMUC by THOIGIANNAU

Source Sum of

Squares

Df Mean Square

Trang 32

9.Biểu diễn biểu đồ mean plot, nhận xét?

THOIGIANNAU 20

22 24 26 28 30

cao

Trang 33

Bài 20: Kết quả thí nghiệm độ chắc của sản phẩm được xử lí từ 6 hàm lượng khác

1.Yếu tố thí nghiệm là hàm lượng gelatin

2.Kết quả thí nghiệm là độ chắc ở các mức hàm lượng gelatin

3.Nghiệm thức của thí nghiệm là 5

4.Số đơn vị thí nghiệm là 25

5.Các yếu tố khác cần phải giữ như nhau ở mỗi ĐVTN là cùng một loại gelatin,cùng

dụng cụ, cùng thời gian, cùng người thực hiện, cùng thao tác

6.Xác định các đại lượng thống kê, nhận xét?

Summary Statistics for DINHMUC

Minimu m

Maximu m

Rang e

Trang 34

7.Bảng kết quả phân tích phương sai, nhận xét?

ANOVA Table for DINHMUC by HAMLUONGGELATIN

Source Sum of

Squares

Df Mean Square

Để xác định phương tiện nào khác biệt đáng kể so với những phương tiện khác, hãy chọn Kiểm tra Nhiều Phạm vi từ danh sách Tùy chọn Bảng

8.So sánh các trung bình bằng trắc nghiệm LSD ( nếu có) , nhận xét?

Multiple Range Tests for DINHMUC by HAMLUONGGELATIN

Method: 95.0 percent LSD

Trang 36

khác biệt có ý nghĩa thống kê Phương pháp hiện đang được sử dụng để phân biệt giữacác phương tiện là thủ tục có sự khác biệt nhỏ nhất có ý nghĩa (LSD) của Fisher Với phương pháp này, có 5,0% rủi ro khi gọi mỗi cặp phương tiện là khác nhau đáng kể khi chênh lệch thực tế bằng 0.

9.Biểu diễn biểu đồ mean plot, nhận xét?

HAMLUONGGELATIN 190

Nhận xét: không có giá trị nào trùng nhau

10.Viết báo cáo kết quả và kết luận của thí nghiệm? (chọn hàm lượng gelatin nào, tiêuchí: độ chắc cao nhất): Chọn hàm lượng gelatin 40g/l vì ở đây có độ chắc cao nhất

Bài 21: Trong thí nghiệm khỏa sát định mức sơ chế của 3 cỡ cá khác nhau

- Kiểu bố trí thí nghiệm: thí nghiệm bố trí theo kiểu hoàn toàn ngẫu nhiên 1 yếu tố

- Yếu tố thí nghiệm: kích cỡ cá

- Số mức độ của yếu tố: 5 mức độ

Trang 37

- Số lần lặp lại trong nghiệm thức: 5 lần.

- Số đơn vị thí nghiệm: 25 đơn vị

- Chỉ tiêu theo dõi: định mức sơ chế của cá

- Yếu tố khác: được giữ như nhau ở mỗi đơn vị thí nghiệm là: 1 loại cá, 1 chất lượng cá, 1 cái cân, 1 người làm, 1 cách làm

Bậc tự doDf

Mean Square

Trang 38

- Số lần lặp lại trong nghiệm thức: 5 lần

- Số đơn vị thí nghiệm: 25 đơn vị

- Chỉ tiêu theo dõi: thời gian bảo quản

- Yếu tố khác: được giữ như nhau ở mỗi đơn vị thí nghiệm là: 1 loại sản phẩm,

1 thời gian, dụng cụ đo lường, 1 cách làm, 1 nhiệt độ

Trang 39

thiên độ lệch

bình phương

đo ở 4 vị trí khác nhau trên sản phẩm:

1 Yếu tố chính của thí nghiệm là chất phụ gia

Yếu tố ngoại cảnh của thí nghiệm là vị trí đo

2 Chỉ tiêu theo dõi của thí nghiệm là độ cứng của sản phẩm

3 Nghiệm thức của thí nghiệm là A,B,C,D

4 Số đơn vị thí nghiệm là 16

5 Các yếu tố khác cần phải giữ như nhau ở mỗi đơn vị thí nghiệm là cùng một quy trình, thông số kỹ thuật, bề dày sản phẩm như nhau, cùng một dụng cụ đo, cùng ngườithực hiện,…

6 Xác định các đại lượng thống kê, nhận xét

Trang 40

Ratio

Homogeneous Groups

Trang 41

* denotes a statistically significant difference.

Nhận xét: Bảng này áp dụng quy trình so sánh nhiều lần để xác định phương tiện nào

khác biệt đáng kể so với phương tiện khác Nửa dưới của kết quả hiển thị sự khác biệtước tính giữa mỗi cặp phương tiện Một dấu hoa thị đã được đặt bên cạnh 3 cặp, cho thấy rằng các cặp này cho thấy sự khác biệt có ý nghĩa thống kê ở mức độ tin cậy 95,0% Ở đầu trang, 2 nhóm đồng nhất được xác định bằng cách sử dụng các cột của

X Trong mỗi cột, các cấp độ chứa X tạo thành một nhóm các phương tiện mà trong

đó không có sự khác biệt có ý nghĩa thống kê Phương pháp hiện đang được sử dụng

để phân biệt giữa các phương tiện là thủ tục có sự khác biệt nhỏ nhất có ý nghĩa (LSD) của Fisher Với phương pháp này, có 5,0% rủi ro khi gọi mỗi cặp phương tiện

là khác nhau đáng kể khi chênh lệch thực tế bằng 0

9 Biểu diễn biểu đồ mean plot

Tiêu đề	Thống Kê Ứng Dụng
Tác giả	Đặng Thị Kim Dung
Người hướng dẫn	Nguyễn Anh Trinh
Trường học	Trường Đại Học Nông Lâm Thành Phố Hồ Chí Minh
Chuyên ngành	Công Nghệ Thực Phẩm
Thể loại	Bài tập
Thành phố	Thành Phố Hồ Chí Minh

Định dạng
Số trang	116
Dung lượng	0,94 MB