1. Trang chủ
  2. » Luận Văn - Báo Cáo

tiểu luận thống kê ứng dụng và phương pháp thí nghiệm

159 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Thống kê ứng dụng và phương pháp thí nghiệm
Tác giả Nguyễn Huỳnh Bích Phương
Người hướng dẫn Nguyễn Anh Trinh
Trường học Trường Đại học Nông Lâm Tp. Hồ Chí Minh
Chuyên ngành Thống kê ứng dụng và phương pháp thí nghiệm
Thể loại Tiểu luận
Thành phố Tp. Hồ Chí Minh
Định dạng
Số trang 159
Dung lượng 4,94 MB

Nội dung

Mẫu là lựa chọn ngẫu nhiên của tổng thể và là một nhóm nhỏ được rút ra từ tổngthể, có các đặc điểm của toàn bộ tổng thể.Ví dụ: Người ta chọn ta 200 bóng đèn mà công ty A sản xuất làm mẫu

Trang 1

TRƯỜNG ĐẠI HỌC NÔNG LÂM TP HỒ CHÍ MINH

KHOA CÔNG NGHỆ HOÁ HỌC & THỰC PHẨM

Trang 2

Bài tập 1

1 Thống kê:

Thống kê là một hệ thống các phương pháp sử dụng mô hình, sự biểu diễn vàtóm tắt định lượng một tập dữ liệu thực nghiệm hoặc nghiên cứu thực tế nhấtđịnh nhằm phục vụ cho quá trình phân tích, dự đoán và ra quyết định

Ví dụ: Dưới đây là số liệu thống kê của một cuộc điều tra về số dân phân định

theo giới tính và phân theo thành thị, nông thôn tại một số tỉnh, Thành phố tạiViệt Nam

2 Thống kê ứng dụng:

Thống kê ứng dụng bao gồm lập kế hoạch về thu thập dữ liệu, quản lý dữ liệu,phân tích, diễn giải và rút ra kết luận từ dữ liệu đó đồng thời xác định các vấn đề,giải pháp bằng cách sử dụng phân tích

Trang 3

Các nhà thống kê sử dụng số liệu thống kê ứng dụng để giải quyết các vấn đềthực tế, quyết định dữ liệu nào cần thu nhập, xác định cách thu nhập dữ liệu đó.Sau đó phân tích và diễn giải dữ liệu bằng các công cụ, thuật toán và phần mềmthống kê.

Ví dụ: Xác định xu hướng thị trường chứng khoán

_Số liệu thống kê có thể bị lạm dụng: hạn chế lớn nhất của số liệu thống kê là nó

có thể bị lạm dụng Việc lạm dụng số liệu thống kê có thể phát sinh một số lý do

Ví dụ: kết luận thống kê dựa trên thông tin không đầy đủ, có thể dẫn đến sai lầm.

Lập luận cho rằng uống bia có hại cho tuổi thọ vì 99% ố người uống bia chết

Trang 4

trước 100 là sai sót về mặt thống kê, vì chúng ta không biết bao nhiêu phần trăm

số người không uống bia chết trước tuổi dố

_Số liệu thống kê là tổng hợp của các sự kiện, vì vậy một quan sát đơn lẻ khôngphải là số liệu thống kê

4 Thống kê mô tả (descriptive statistics):

Thống kê mô tả được hiểu là các phương pháp liên quan đến việc thu thập số liệu,tóm tắt, trình bày, tính toán và mô tả các đặc trưng khác nhau để phản ánh mộtcách tổng quát đối tượng nghiên cứu

Ví dụ: Điểm trung bình của học sinh (GPA) là một dạng thông tin có được từ ứng

dụng thống kê mô tả trong thực tiễn GPA là trung bình của dữ liệu từ một loạtcác bài kiểm tra, lớp học và điểm số với nhau để xem xét khả năng học tập chungcủa học sinh Điểm trung bình cá nhân của học sinh phản ánh kết quả học tậptrung bình chung của học sinh đó

Trang 5

5 Thống kê suy luận (inferential statistics):

Thống kê suy luận bao gồm các phương pháp ước lượng các đặc trưng của tổngthể, phân tích mối liên hệ giữa các hiện tượng nghiên cứu, dự đoán hoặc ra quyếtđịnh trên cơ sở thu thập thông tin từ kết quả quan sát mẫu

Ví dụ: Một lớp học gồm 50 học sinh Trong đó, các bạn nữ cho rằng mỗi lần

kiểm tra miệng thì họ bi gọi nhiều hơn các bạn nam Họ cho rằng như vậy giáoviên đang thiên vị Còn giáo viên thi cho rằng họ thực hiện điều này là một cách

Trang 6

ngẫu nhiên Và để xem ai đúng, ai sai trong trường hợp này ta sẽ cần phải đặt giảthuyết thống kê thông qua suy luận thống kê.

6 Tổng thể (population):

Tổng thể là một thuật ngữ thống kê được sử dụng để chỉ toàn bộ các cá thể hoặcđối tượng mà nhà nghiên cứu đang quan tâm trong một nghiên cứu

Trong thống kê, tổng thể là mẫu đại diện của một nhóm nười/những vật lớn hơn

có một hoặc nhiểu đặc điểm chung

Ví dụ: Tổng thể này có thể được đo lường bằng nhiều biến số như tuổi, giới tính,

dân tộc, nghề nghiệp, thu nhập, giáo dục, Khi muốn tìm hiểu về thu nhập bìnhquân của cả dân cư Việt Nam, ta sẽ cần phải xác định tổng thể là tất cả các cưdân trong đất nước này Tuy nhiên, để thực hiện việc điều tra, ghi chép và phântích một tổng thể với hàng triệu người sẽ là một nhiệm vụ khó khăn và tốn kém.Thay vào đó, ngành thống kê sẽ chọn ra một mẫu gồm một số đơn vị đại diện chotổng thể và tiến hành điều tra trên mẫu này Ví dụ, ngành thống kê Việt Nam cóthể chọn ra một mẫu ngẫu nhiên gồm 1.000 người trong dân số 100 triệu người

để điều tra thu nhập của họ Sau đó, dựa trên kết quả điều tra mẫu này, ngànhthống kê sẽ suy ra thông tin về thu nhập bình quân của toàn bộ dân cư Việt Nam

7 Mẫu (sample):

Mẫu là một bộ phận của một tổng thể (thống kê) có thể dùng để thực hiện cácước lượng về tổng thể mà không phải tiến hành tổng điều tra về toàn bộ các đơn

vị của một tổng thể

Trang 7

Mẫu là lựa chọn ngẫu nhiên của tổng thể và là một nhóm nhỏ được rút ra từ tổngthể, có các đặc điểm của toàn bộ tổng thể.

Ví dụ: Người ta chọn ta 200 bóng đèn mà công ty A sản xuất làm mẫu để kiểm

tra tuổi thọ của chúng

8 Các loại nghiên cứu thực phẩm (Types of Food research study):

Các loại hình sản xuất thực phẩm:

Sản xuất thực phẩm được phân loại thành nhiều loại khác nhau bao gồm trồngtrọt, lựa chọn, quản lý cây trồng, thu hoạch, sản xuất cây trồng, bảo quản, nướng,thanh trùng, bánh pudding, chạm khắc, giết thịt, lên men, ngâm chua, làm đồuống và kẹo, nhà hàng, v.v

Trang 8

_Luộc, nướng, chiên, nướng, hấp và trộn.

_Thanh trùng

_Chế biến nước trái cây

_Loại bỏ các lớp bên ngoài bằng cách lột và lột da

_Khí hóa nước giải khát

_Bảo quản và đóng gói thực phẩm bằng túi hút chân không

9 Biến (variable):

Biến trong Toán học được định nghĩa là ký tự chữ cái biểu thị một giá trị số hoặcmột số Trong các phương trình đại số, một biến được sử dụng để biểu diễn mộtđại lượng chưa biết

Các biến này có thể là bất kỳ bảng chữ cái nào từ a đến z Thông thường nhất,'a','b','c', 'x','y' và 'z' được sử dụng làm biến trong phương trình

Thực hiện các phép tính số học với các biến như thể chúng là các số rõ ràng chophép người ta xử lý phạm vi vấn đề trong một phép tính đơn độc Một minh họathông thường là một công thức bậc hai, cho phép người ta giải thích từng điềukiện bậc hai bằng cách thay thế các ước lượng bằng số của các hệ số của điềukiện đưa ra bằng các biến đại diện cho chúng

Ý tưởng về một biến có ý nghĩa quan trọng trong toán học Thông thường, mộthàm y = f(x) bao gồm hai biến y và x, đại diện riêng cho chất lượng và sự tranhchấp của hàm Cụm từ “biến” bắt nguồn từ việc khi đối số (còn gọi là “biến côngsuất”) dịch chuyển thì chất lượng cũng thay đổi tương ứng

10 Xác suất (Probability)

Xác suất là thước đo khả năng xảy ra một sự kiện Nhiều sự kiện không thể dựđoán được một cách hoàn toàn chắc chắn Chúng ta chỉ có thể dự đoán khả năngxảy ra một sự kiện, tức là khả năng chúng sẽ xảy ra bằng cách sử dụng nó Xácsuất có thể nằm trong khoảng từ 0 đến 1, trong đó 0 có nghĩa là sự kiện không thểxảy ra và 1 biểu thị một sự kiện nhất định Xác suất vào lớp 10 là một chủ đềquan trọng đối với học sinh, nó giải thích tất cả các khái niệm cơ bản của chủ đềnày Xác suất của tất cả các sự kiện trong không gian mẫu có tổng bằng 1

Trang 9

Ví dụ: khi chúng ta tung một đồng xu, chúng ta nhận được Đầu HOẶC Đuôi, chỉ

có hai kết quả có thể xảy ra (H, T) Nhưng khi tung hai đồng xu thì sẽ có bốn kếtquả có thể xảy ra, tức là {(H, H), (H, T), (T, H), (T, T)}

Trang 11

Nhận xét: Vì S = 0.94817> 0 nên phân bố dữ liệu lệch về bên phải.

2.2 Given a set of observations X={3, 5, 6, 7, 0} Calculate the mean, standarddeviation and median ?

Calculate the mean

Số liệu có sự biến thiên xung quanh giá trị trung bình

2.4 Some characteristics of tmineral contents for B and W product are as follows:

2.5 Write down a list of 10 numbers satisfying both the following criteria:

(a) the median < the mean

(b) the mode < the median

{1,2,2,3,5,7,9,10,12,15}

a) Median=6<mean=6.6

b) Mode=2< Median=6

BÀI TẬP 3:

Trang 12

THIẾT KẾ THÍ NGHIỆMNghiên cứu quá trình phát triển:

1 Sản phẩm thịt: xúc xích Đức

Trang 13

2 Sản phẩm thuỷ sản: cá nục đóng hộp sốt cà

3 Sản phẩm thực vật: cà chua đóng hộp bóc vỏ

Trang 14

4 Sản phẩm trái cây: dứa nước đường

Trang 15

5 Sản phẩm sữa: sữa chua đón hộp

Trang 16

6 Sản phẩm ngũ cốc: bột ngũ cốc dinh dưỡng

Trang 17

Ngũ cốc Mạch nha Dầu thực vật

Trộn Nghiền

Các chất vi

Nước

Bột nền

Sản phẩm

Trang 18

7 Sản phẩm dạng bột: tinh bột khoai mì

8 Sản phẩm trứng: bánh flan

Trang 19

9 Sản phẩm rong biển: nước rong biển

Trang 20

10 Sản phẩm trà: trà Kombucha

Trang 21

Nghiên cứu quá trình bảo quản

1 Bảo quản ngũ cốc:

Trang 22

2 Bảo quản trứng:

Trang 23

3 Bảo quản rong biển:

4 Bảo quản khoai tây:

Trang 24

5 Bảo quản cây lấy củ: củ cải trắng

6 Bảo quản thịt: thịt lợn

Trang 25

7 Bảo quản cá:

Trang 26

8 Bảo quản rau:

Trang 27

9 Bảo quản trái cây:

Trang 28

10 Bảo quản sữa:

Trang 29

1.Xác định tham số thống kê : là thống kê mô tả

A : 7 giá trị nằm trong khoảng giá trị từ 14,8 đến 19,1

B : 7 giá trị nằm trong khoảng giá trị từ 17,2 đến 21,1

Trang 30

so với mức chuẩn, điều này có xu hướng làm mất hiệu lực các thử nghiệm sosánh độ lệch chuẩn Trong trường hợp này, cả hai giá trị độ lệch được tiêu chuẩnhóa đều nằm trong phạm vi dự kiến Cả hai giá trị độ nhọn được tiêu chuẩn hóađều nằm trong phạm vi dự kiến.

2 So sánh trung bình hai mẫu:

Khoảng tin cậy 95,0% cho sự khác biệt giữa các phương tiện

giả sử phương sai bằng nhau: -2,52857 +/- 1,67715 [-4,20572, -0,851424]kiểm tra t để so sánh có nghĩa là

Giả thuyết không: giá trị trung bình1 = giá trị trung bình2

thay thế giả thuyết: trung bình1 NE trung bình2

giả sử phương sai bằng nhau: t = -3,28492 Giá trị P = 0,0065204

Bác bỏ giả thuyết không với alpha = 0,05

The StatAdvisor

Trang 31

Tùy chọn này chạy thử nghiệm t để so sánh giá trị trung bình của hai mẫu Nócũng xây dựng các khoảng hoặc giới hạn tin cậy cho từng giá trị trung bình vàcho sự khác biệt giữa các giá trị trung bình Điều đặc biệt quan tâm là khoảng tincậy cho sự khác biệt giữa các giá trị trung bình, kéo dài từ -4,20572 đến -

0,851424 Vì khoảng không chứa giá trị 0 nên có sự khác biệt có ý nghĩa thống

kê giữa giá trị trung bình của hai mẫu ở mức độ tin cậy 95,0%

Phép thử t cũng có thể được sử dụng để kiểm tra một giả thuyết cụ thể về sự khácbiệt giữa giá trị trung bình của các tổng thể chứa hai mẫu Trong trường hợp này,phép thử được xây dựng để xác định xem chênh lệch giữa hai giá trị trung bình

có bằng 0,0 hay không so với giả thuyết thay thế rằng chênh lệch không bằng 0,0

Vì giá trị P được tính toán nhỏ hơn 0,05 nên chúng ta có thể bác bỏ giả thuyếtkhông và ủng hộ phương án thay thế

LƯU Ý: những kết quả này giả định rằng phương sai của hai mẫu là bằng nhau.Trong trường hợp này, giả định đó có vẻ hợp lý dựa trên kết quả của phép thử F

để so sánh độ lệch chuẩn Bạn có thể xem kết quả của bài kiểm tra đó bằng cáchchọn So sánh độ lệch chuẩn từ menu Tùy chọn dạng bảng

3 Biểu diễn biểu đồ phân phối tần suất ?

Trang 32

*Nhận xét:

A

B 3

2 1 0 1 2 3

Trang 33

95.0% confidence interval for the difference between the means

assuming equal variances: 0.278333 +/- 0.429714 [-0.15138;0.708047]

t test to compare means

Null hypothesis: mean1 = mean2

Alt hypothesis: mean1 NE mean2

assuming equal variances: t = 1.44321 P-value =0.179546

Do not reject the null hypothesis for alpha = 0.05

Trang 34

pHA

pHB 4

2 0 2 4

Trang 35

95.0% confidence interval for the difference between the means

assuming equal variances: 0.362857 +/- 1.84258 [-1.47972; 2.20543]

t test to compare means

Null hypothesis: mean1 = mean2

Alt hypothesis: mean1 NE mean2

assuming equal variances: t = 0.429073 P-value =0.675473

Do not reject the null hypothesis for alpha = 0.05

3

NONEHEATTREATMENT

HEATTREATMENT 4

2 0 2 4

Trang 36

95.0% confidence interval for the difference between the means

assuming equal variances: 10.1429 +/- 7.32177 [2.82108;17.4646]

t test to compare means

Null hypothesis: mean1 = mean2

Alt hypothesis: mean1 NE mean2

assuming equal variances: t = 3.01832 P-value =0.0106963

Reject the null hypothesis for alpha = 0.05

3

OVEN

MICROWARE 5

3 1 1 3 5

Trang 37

P-value =0.0106963< 0.05  2 giá trị trung bình khác biệt có ý nghĩa thống kê

ở độ tin cậy 95% Highest OVEN

Trang 38

Bài tập 5:

5.1

1 Yếu tố thí nghiệm là Fish size: A, B, C

2 Kết quả thí nghiệm là số liệu về tiêu chuẩn của sản phẩm đó đối với 3 kích cỡ

Trang 39

Multiple Range Tests for DINHMUC by FISHSIZE

Trang 40

A B C

Means and 95.0 Percent LSD Intervals

FISHSIZE 1.4

- Từ bảng phân tích phương sai ANOVA: P =0.0208< 0.05 ở độ tin cậy 95%

giá trị trung bình khác biệt có ý nghĩa thống kê, yếu tố kích cỡ cá ảnh hưởngđến định mức

- Xét ở độ tin cậy 95%, kích cỡ cá A có giá trị tiêu chuẩn trung bình thấp nhất.Kích cỡ cá A không trùng kích cỡ cá B, C nên có ý nghĩa thống kê Kích cỡ cá B,

C trùng nhau nên không có ý nghĩa thống kê

5.2

1 Yếu tố thí nghiệm là thời gian chế biến sản phẩm

2 Kết quả thí nghiệm là số liệu về hàm lượng vitamin C trong sản phẩm ở 5 thờigian chế biến khác nhau sau 5 lần lặp lại

3 Nghiệm thức của thí nghiệm là giá trị hàm lượng vitamin C trong sản phẩmtương ứng với mỗi thời gian chế biến

Trang 41

4 Có 25 đơn vị thí nghiệm.

5 Các yếu tố khác bao gồm quy trình sản xuất, tỷ lệ các nguyên liệu khác, địa

điểm sản xuất, thời gian sản xuất, dụng cụ đo, vị trí đo, điều kiện môi trường tại

Trang 42

22 24 26 28 30

- Từ bảng phân tích phương sai ANOVA: P =0.1658> 0.05 ở độ tin cậy 95%

giá trị trung bình khác biệt không có ý nghĩa thống kê Thời gian chế biếnkhông ảnh hưởng đến hàm lượng vitamin C

- Xét ở độ tin cậy 95%, hàm lượng vitamin C xử lý trong 15p có giá trị trungbình cao nhất Muốn có hàm lượng vitamin C nhiều nhất cần chọn thời gian 15,

20, 25 hoặc 35p

5.3

1 Yếu tố thí nghiệm là phụ gia thực phẩm

Trang 43

2 Kết quả thí nghiệm là số liệu về độ cứng của sản phẩm khi sử dụng 4 loại phụgia và lặp lại thí nghiệm 4 lần.

3 Nghiệm thức của thí nghiệm là các giá trị về độ cứng của sản phẩm tương ứngvới mỗi loại phụ gia

4 Có 16 đơn vị thí nghiệm

5 Các yếu tố khác bao gồm quy trình sản xuất, tỷ lệ các nguyên liệu khác, địađiểm sản xuất, thời gian sản xuất, dụng cụ đo, vị trí đo, điều kiện môi trường tạithời điểm đó

6

Table of Least Squares Means for HARDNESS with 95.0 Percent

Confidence Intervals

Stnd Lower Upper Level Count Mean Error Limit Limit

Analysis of Variance for HARDNESS - Type III Sums of Squares

Trang 44

P-Squares Square Ratio Value

All F-ratios are based on the residual mean square error

8.Multiple Range Tests for HARDNESS by ADDITIVES

Trang 45

Means and 95.0 Percent LSD Intervals

ADDITIVES 93

95 97 99 101

5.4

1 Yếu tố thí nghiệm là tỷ lệ phụ gia

2 Kết quả thí nghiệm là số liệu về độ giòn của sản phẩm khi sử dụng 4 tỷ lệ phụgia khác nhau và lặp lại thí nghiệm 4 lần

3 Nghiệm thức của thí nghiệm là giá trị độ giòn của sản phầm tương ứng vớimỗi tỷ lệ phụ gia

4 Có 16 đơn vị thí nghiệm

Trang 46

5 Các yếu tố khác bao gồm quy trình sản xuất, tỷ lệ các nguyên liệu khác, địađiểm sản xuất, thời gian sản xuất, dụng cụ đo, vị trí đo, điều kiện môi trường tạithời điểm đó.

6.Table of Least Squares Means for FRACTURABILITY with 95.0 Percent Confidence Intervals

Stnd Lower Upper Level Count Mean Error Limit Limit

All F-ratios are based on the residual mean square error

8.Multiple Range Tests for FRACTURABILITY by ADDITIVES

Method: 95.0 percent LSD

Trang 48

Means and 95.0 Percent LSD Intervals

ADDITIVES 9.3

5.5

1 Yếu tố thí nghiệm là nhiệt độ chế biến sản phẩm

2 Kết quả của thí nghiệm là các giá trị độ liên kết của sản phẩm khi nấu ở 4 nhiệt

độ khác nhau và trong 4 lần đo lặp lại

3 Nghiệm thức của thí nghiệm là giá trị độ liên kết tương ứng với mỗi nhiệt độ

4 Có 16 đơn vị thí nghiệm

5 Các yếu tố khác bao gồm quy trình chế biến, nguyên liệu chế biến, thời điểm

đo, máy đo

Trang 49

6.Table of Least Squares Means for COHESIVENESS with 95.0 Percent Confidence Intervals

Stnd Lower Upper Level Count Mean Error Limit Limit

All F-ratios are based on the residual mean square error

8.Multiple Range Tests for COHESIVENESS by TEMPERATURE

Method: 95.0 percent LSD

TEMPERATU

RE Count LS Mean LS Sigma Homogeneous Groups

Trang 51

Means and 95.0 Percent LSD Intervals

TEMPERATURE 7

- Xét ở độ tin cậy 95%, độ liên kết của sản phẩm được chế biến ở nhiệt độ 60℃

có giá trị thấp nhất nhưng lại khong có khác biệt ý nghĩa thống kê với độ liên kếtcủa sản phẩm được chế biến ở các nhiệt độ khác Muốn chọn nhiệt độ giúp độliên kết cao thì 4 nhiệt độ trên đều có thể sử dụng

5.6

1 Yếu tố thí nghiệm là mức năng lượng dùng trong chế biến

2 Kết quả thí nghiệm là độ cứng của sản phẩm trong 4 mức năng lượng khácnhau qua 4 lần đo

3 Nghiệm thức của thí nghiệm là các giá trị độ cứng sản phẩm tương ứng vớimỗi mức năng lượng

4 Có 20 đơn vị thí nghiệm

Ngày đăng: 31/07/2024, 17:13