1. Trang chủ
  2. » Thể loại khác

baigiang tin hoc xu li so lieu ppt

294 2K 6

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 294
Dung lượng 900,5 KB

Nội dung

1.3 Các bước trong nghiên cứu thực phẩm Xác định nhiệm vụ, đối tượng, dân số  Tính toán số lượng đơn vị cần thu thập theo qui định thống kê  Thu thập dữ kiện  Lưu trữ và xử lý số liệ

Trang 1

TIN HỌC ỨNG DỤNG TRONG HOÁ HỌC - THỰC PHẨM

Trang 2

Mục tiêu

 Giúp sinh viên độc lập trong nghiên cứu

khoa học, có khả năng xử lý số liệu thường gặp trong điều tra, nghiên cứu trong hoá học - thực phẩm

 Trang bị cho sinh viên kỹ năng sử dụng

phần mềm tin học trong việc giải quyết

xử lý, trình bày số liệu và giải quyết một

số bài toán trong thực phẩm

Trang 3

Tài liệu tham khảo

Nguyễn Ngọc Kiểng, Thống kê học trong

nghiên cứu khoa học, NXB Giáo dục, 1996.

Lê Đức Ngọc, Xử lý số liệu và kế hoạch hóa

thực nghiệm, Khoa Hóa, ĐHQGHN, 2001.

Nguyễn Cảnh, Quy hoạch thực nghiệm, NXB

Đại học Quốc gia, 2004

Phan Hiếu Hiền, Phương pháp bố trí nghiệm

Trang 4

4. Phân tích hồi qui và tương quan

5. Một số bài toán trong công nghệ thực

phẩm

Trang 5

1 Tin học ứng dụng trong nghiên cứu hoá học thực phẩm

 Khoa học thực phẩm

 Các dạng nghiên cứu thực phẩm

 Các bước trong nghiên cứu thực phẩm

 Tin học ứng dụng trong nghiên cứu thực

phẩm

Trang 6

1.1 Khoa học thực phẩm

 Nghiên cứu các tác động qua lại của các

yếu tố ảnh hưởng đến chất lượng thực

phẩm

 Kỹ thuật thực phẩm liên quan đến qui

trình, thiết bị, con người, vi sinh vật…

 Giải quyết vấn đề: Chất lượng, An toàn,

Kỹ thuật chế biến

Trang 7

1.2 Các dạng nghiên cứu thực phẩm

 Bố trí thí nghiệm bảo quản & chế biến

sản phẩm thực phẩm

 Phân tích diễn biến chất lượng qua thời

gian bảo quản

 Điều tra các yếu tố vật lý, hóa học, sinh

học ảnh hưởng đến chất lượng sản phẩm, đánh giá hiệu quả của biện pháp xử lý,

khắc phục

Trang 8

1.3 Các bước trong nghiên cứu thực phẩm

 Xác định nhiệm vụ, đối tượng, dân số

 Tính toán số lượng đơn vị cần thu thập

theo qui định thống kê

 Thu thập dữ kiện

 Lưu trữ và xử lý số liệu

 Phân tích kết quả và viết báo cáo

 Các bước trong nghiên cứu phát triển

sản phẩm thực phẩm mới

Trang 9

Xác định nhiệm vụ, đối tượng, dân số

 Trước khi tiến hành thu thập dữ kiện,

phải hiểu mình muốn biết gì khi điều tra nghiên cứu

 xác định nhiệm vụ là việc hàng đầu

trước khi thu thập dữ kiện

Trang 10

Tính toán số lượng đơn vị cần thu thập theo qui định thống kê

 Việc xác định dung lượng mẫu cần thiết

cho cuộc điều tra có ảnh hưởng đến kết quả đánh giá và suy diễn kết luận về

quần thể thông qua tập hợp mẫu

 Thu thập không đủ số lượng đơn vị cho

mẫu điều tra sẽ làm lệch sự suy diễn, phi khoa học và dẫn đến sự ngộ nhận gây ra những hậu quả không lường được

Trang 11

Thu thập dữ kiện

 Khi điều tra nghiên cứu, phải thực hiện

việc thu thập dữ kiện

 Trong khi thu thập dữ kiện phải thực

hiện việc ghi chép thông qua các bảng ghi số liệu khảo sát

Trang 12

Lưu trữ và xử lý số liệu

Hình thức, phương pháp lưu trữ dữ kiện thu

thập ngoài hiện trường hay kết quả phân tích trong phòng thí nghiệm đa dạng tùy theo mục đích điều tra nghiên cứu:

 Dưới dạng bảng tính

 Dưới dạng cơ sở dữ liệu

 Lưu trữ trực tiếp vào phần mềm xử lý

thống kê

Trang 13

Phân tích kết quả và viết báo cáo

Một bảng thống kê kết quả chủ yếu gồm

các thành phần sau:

 Tựa đề của bảng

 Các đầu đề dữ kiện

 Nguồn gốc dữ kiện

Trang 14

Các bước trong nghiên cứu phát triển sản phẩm thực phẩm mới

 Xác định loại sản phẩm

 Tìm hiểu quy trình sản xuất

 Xây dựng quy trình công nghệ

 Thử nghiệm sản xuất quy mô PTN

 Mô hình hóa quy trình sản xuất

 Nhân rộng quy mô sản xuất

 Phát triển sản xuất

 Nghiên cứu đánh giá thị trường

Trang 15

1.4 Tin học ứng dụng trong nghiên cứu thực phẩm

Trong mọi ngành khoa học thực nghiệm:

 thực tế

 thí nghiệm

Kết quả bằng số:

 là giá trị của một biến ngẫu nhiên

 phụ thuộc vào nhiều yếu tố

kết quả bằng số

Trang 16

1.4 Tin học ứng dụng trong nghiên cứu

thực phẩm

Qui luật được:

 nghiên cứu trên một tập hợp con (mẫu)

 ước lượng cho tổng thể với độ tin cậy

Xử lý số liệu

 dữ liệu thô-tính toán, sắp xếp- dữ liệu tinh

 làm cơ sở cho việc diễn giải, phân tích thống kê

Trang 17

1.4 Tin học ứng dụng trong nghiên cứu thực phẩm

Trang 18

2 Bố trí thí nghiệm trong nghiên cứu

 Khái niệm liên quan đến vấn đề thí

nghiệm

 Nguyên tắc của bố trí thí nghiệm

 Những điều cần tuân thủ khi bố trí thí

nghiệm

 Bố trí thí nghiệm

Trang 19

2.1 Khái niệm liên quan đến vấn đề thí

Trang 20

2.1.1 Khái niệm cơ bản trong thống kê kết quả nghiên cứu

 Một số khái niệm cơ bản

 Phương pháp xử lý số liệu ban đầu

 Đại lượng trung bình

 Các chỉ số biến thiên

 Ước lượng và kiểm định giả thiết thống

kê trong nghiên cứu

Trang 21

Một số khái niệm cơ bản

 Phân tích thống kê

 Mô tả dữ kiện

 Công cụ của thống kê

 Biến số

Trang 22

Thống kê là gì?

 Các con số tóm lược thông tin định lượng

 Phương pháp tính toán để giúp chúng ta tóm lược hoặc khái quát hoá thông tin

 Kỹ thuật giúp quyết định vấn đề như phân tích phương sai, tương quan hồi qui, trắc nghiệm, …

Trang 23

Giới hạn của thống kê

 Sử dụng thống kê phải biết rành về lĩnh vực chuyên môn của người nghiên cứu

 Thống kê chỉ là phương tiện, công cụ

 Thống kê trình bày những số liệu hoặc hiện tượng rời rạc một cách hệ thống hơn, chứ không nói được bản chất của sự việc

 Thống kê không thay thế được cho suy

Trang 24

Thống kê mô tả

 Là một trong những bước đầu tiên để phân tích vấn đề và thực hiện một quyết định

 Gồm các tính toán cơ bản mang tính chất

mô tả như trung bình, phương sai, độ lệch chuẩn, … nhằm tổng kết về kết quả của thí nghiệm

Trang 25

Thống kê mô tả

 Phương pháp tóm lược thông tin để làm cho chúng trở nên dễ hiểu tức giảm một

số lớn các số liệu phức tạp thành một số nhỏ hơn gồm các giá trị tóm tắt

 Mô tả mối quan hệ giữa các biến số

Trang 26

Thống kê suy diễn

 Khái quát hoá thông tin của một mẫu cho toàn dân số của mẫu tức là chỉ đo đếm trên một tiểu tập hợp rồi suy luận cho toàn bộ với một độ tin cậy nào đó

 Cung cấp kỹ thuật để kiểm tra trên một mẫu và sử dụng thông tin này để suy rộng ra các đặc tính của toàn bộ dân số

Trang 27

Mô tả dữ kiện

 Hai biến số có giá trị trung bình như

nhau nhưng độ phân tán không giống nhau

 độ phân tán cho biết thông tin để đánh

giá độ tin cậy của giá trị tập trung

Trang 28

Mô tả dữ kiện

 Phân phối dân số

 Phân phối mẫu

 Phân phối chuẩn

Trang 29

Phân phối dân số

 là phân phối của những điểm số trong một dân số

Trang 30

Phân phối mẫu

 là phân phối của những điểm số trong một mẫu có kích cỡ nhất định

 là phân phối của một thống kê nào đó của tất cả các mẫu có cùng một kích cỡ trong dân số

Trang 31

Phân phối chuẩn

 Khi vẽ biểu đồ tương quan giữa tần số và kết quả thu nhận, hình dạng đường cong thông thường có dạng hình chuông gọi là phân phối chuẩn

Trang 32

Phân phối chuẩn

 Là một phân phối đối xứng có dạng hình chuông, biểu diễn bằng phương trình:

π δ

δ µ

2

2

2 / 2 )

( −

Y

Trang 33

 Hai phân phối chuẩn với độ lệch chuẩn khác nhau:

độ lệch chuẩn nhỏ cho phép khái quát hoá những kết quả của mẫu cho toàn dân số

Trang 34

Phân phối chuẩn

Trang 35

Phân phối chuẩn

Trong một phân phối chuẩn, khoảng:

 68% số liệu trong khoảng X ±SD

 95% số liệu trong khoảng X ±2SD

 99% số liệu trong khoảng X ±3SD

Trang 36

Phân phối chuẩn

 Có 95% số trường hợp nằm trong độ lệch chuẩn ±1,96 so với giá trị trung bình

 Có 99% số trường hợp nằm trong độ lệch chuẩn ±2,58 so với giá trị trung bình

Trang 37

Các đặc trưng thống kê thường dùng trong mô tả dữ kiện

Các giá trị của một biến số có sự phân phối

là phân tán hay tập trung

 Giá trị đồng nhất (các giá trị của một biến

số có xu hướng quần tụ)

 Giá trị không đồng nhất (các giá trị của một biến số có xu hướng phân tán)

Trang 38

Các đặc trưng thống kê thường dùng trong mô tả dữ kiện

 Trung bình mẫu ước lượng giá trị trung tâm của phân bố

 Độ lệch chuẩn của mẫu liên quan đến sự phân tán của số liệu

Trang 39

Các đặc trưng thống kê thường dùng trong mô tả dữ kiện

 Trung bình mẫu và Độ lệch chuẩn chỉ có giá trị đại diện cho mẫu khi mẫu có phân phối chuẩn

 Độ lệch (skewness) và độ nhọn (kurtosis) dùng để kiểm tra mẫu có phân bố chuẩn hay không

Trang 40

 Độ lệch < 0 (các giá trị có xu hướng tập trung về phía bên trái của đồ thị)

Trang 41

 Độ nhọn < 0 (phân bố có đồ thị bẹt hơn phân bố chuẩn)

Trang 42

Công cụ của thống kê

 Biểu bảng,

 Biểu đồ,

 Các giá trị mô tả (trung bình, độ lệch chuẩn, phương sai, …)

Trang 43

Bảng phân phối tần số

 Sắp xếp, trình bày dữ liệu một cách có hệ thống

 Phân chia dữ liệu thành từng nhóm khác nhau

 Căn cứ để hình thành biểu đồ phân phối tần số

Trang 44

Sơ đồ tổng quát của bảng phân phối tần số

Trị số của biến

(Xi)

Tần số (số lần xuất hiện của trị số - fi)

Trang 45

Sơ đồ tổng quát của bảng phân phối tần số

Trang 46

Sơ đồ tổng quát của bảng phân phối tần số

Năng

suất Tần số Tần số tương

đối (%)

Tần số tích lũy

Tần số tương đối tích lũy

Trang 47

Trị số của biến quan sát

 Số cụ thể

 Khoảng giá trị (khoảng cách có thể bằng nhau hoặc không, có giới hạn trên/dưới hoặc chỉ một giới hạn)

Trang 48

Biểu đồ trong thống kê

 Biểu diễn toàn bộ số liệu

 Thể hiện nét đặc trưng của tập hợp số liệu

 Biểu diễn mối quan hệ giữa tính trạng nghiên cứu và chỉ tiêu theo dõi

Trang 49

Biểu đồ phân phối tần số

 Biểu đồ cột

 Trình bày số quan sát lớn

 Có thể trình bày tần số tương đối, tần số tích lũy, tần số tương đối tích lũy

Trang 50

Biểu đồ phân phối tần số

Trang 51

Biểu đồ phân phối tần số

Trang 52

Biểu đồ tần số tích lũy

Trang 53

Biểu đồ tần số tương đối tích lũy

Trang 54

Biểu đồ hộp

 Khảo sát sơ lược dữ liệu

 Tổng quát về phân phối của mẫu/ tổng thể

 thể hiện ví trí tập trung, phân tán, bất thường

Trang 55

Biểu đồ hộp

Trang 56

Biểu đồ hộp

 Khối hộp ‘box’ kéo dài từ giá trị phân vị

¼ đến giá trị phân vị ¾ , khoảng 50% giá trị nẳm trong ‘box’

 Đường thẳng đứng ở vị trí trung bị mẫu, chia dãy số liệu thành 2 phần bằng nhau, nếu mẫu phân bố đối xứng thì đường này nằm gần trung tâm của khối hộp

Trang 57

Biểu đồ hộp

 Dấu + ở vị trí trung bình của mẫu

 Sự khác biệt đáng kể giữa trung bình và trung vị cho thấy có một vài số liệu có khả năng gây ra sai số làm phân bố của mẫu bị lệch

 Đoạn thẳng hai đầu gọi là ‘whisker’ nối

từ giá trị cực tiểu đến điểm phân vị ¼ và

Trang 58

Biểu đồ điểm

Trang 60

Mẫu (sample)

 Được chọn ngẫu nhiên từ dân số

 Mẫu là một phần và là đại diện của dân số

 Phân tích mẫu có thể suy ra các đặc tính của dân số với một mức độ tin cậy xác định nào đó

Trang 61

Mẫu ngẫu nhiên

 Mẫu lấy từ dân số mà các đơn vị đều có

cơ hội đồng đều nhau, nó mang tính khách quan trong thu thập dữ kiện

Trang 62

Dân số (population)

 Là tập hợp những thông tin về người, sự vật hoặc sự việc riêng biệt kết hợp với

nhau trên cơ sở một đặc điểm chung nào

đó mà người nghiên cứu đang quan tâm

 Là tập hợp toàn bộ các đối tượng nghiên cứu, điều tra, khảo sát Có những đặc

điểm chung vào mục tiêu của điều tra

nghiên cứu môi trường

Trang 63

Dân số

 Thường rất lớn và không thể kiểm tra hết

 Muốn biết thông tin về dân số chỉ có thể

đo đếm trên một tiểu tập hợp gọi là mẫu

Trang 65

Biến số liên tục

 Là các số nguyên dương và thập phân

 Các số đo về chiều dài, trọng lượng, thể tích,

Trang 67

Đơn vị

 đối tượng cụ thể để đo đếm và thu nhập

dữ kiện

 Một mẫu thăm dò sẽ có nhiều đơn vị

 Đơn vị thống kê là một phần tử của một tập hợp mẫu thống kê điều tra khảo sát

 Cần phân biệt giữa đơn vị thống kê và

hình thức thu thập mẫu trong trường hợp

Trang 68

Phương pháp xử lý số liệu ban đầu

 Gọi a là trị thực của đại lượng đo, X là

kết quả đo

 Sai số tuyệt đối (X-a) có thể gồm 3

thành phần là sai số hệ thống, sai số thô, sai số ngẫu nhiên

Trang 69

Sai số hệ thống

 Sai số hệ thống là sai số không đổi hoặc

thay đổi theo một qui luật nhất định

 Sai số hệ thống có thể hiệu chỉnh được

Trang 70

Sai số thô

 Sai số thô là sai số do bất cẩn, trục trặc

kỹ thuật, thay đổi điều kiện đột ngột, …Đặc điểm đơn lẻ, có trị số tuyệt đối lớn hoặc nhỏ một cách bất thường

 Cần loại bỏ các số đo chứa sai số thô để

khỏi ảnh hưởng không trung thực đến

kết quả chung

Trang 71

Sai số ngẫu nhiên

 Sai số ngẫu nhiên là sai số không thể

tiên đoán được cụ thể, do rất nhiều nhân

tố có tác dụng nhỏ không thể tách riêng hoặc tính riêng

 Sai số ngẫu nhiên là sai số mà người làm

thí nghiệm không thể loại bỏ được, phải chấp nhận

Trang 72

Đại lượng trung bình

Trang 74

Mode: (Mo)

 Biến số đơn thức là biến số khi gần như mọi trường hợp đều tập trung về một giá trị

 Biến số nhị thức là biến số khi gần như có hai hay nhiều trường hợp nhất và gần như tương đương nhau

Trang 76

X

Trang 77

Trung bình cộng

 Đại diện cho cả một tập hợp lớn số liệu

 Nêu lên đặc điểm chung nhất của hiện tượng

 Dùng để so sánh các hiện tượng không có cùng qui mô

X

Trang 78

Trung bình cộng số học

n

X X

n i

i

=

= 1

Trang 79

Trung bình có trọng số

 Là trường hợp đặc biệt của trung bình số học khi gía trị của biến xuất hiện nhiều lần

i i

f

f

X X

1 1

Trang 80

Trung bình của dữ liệu phân nhóm có khoảng cách

i i

f

f

m X

1 1

Trang 81

Trung bình nhân (trung bình hình học)

GM

 Căn bậc n cho n giá trị

 Thay cho trung bình cộng trong trường hợp dãy số liệu có phân phối lệch (giá trị đột biến)

n

n

X X

X

GM = 1 2

Trang 83

Các chỉ số biến thiên

 Đại lượng đo lường độ biến thiên

 Mô tả biến thiên

 Điểm số chuẩn hoá

 Sai biệt chuẩn

 Khoảng tin cậy

Trang 84

Đại lượng đo lường độ biến thiên

 Phương pháp đo lường độ biến thiên của các phân phối giúp hiểu rõ phân phối

 Phương sai và độ lệch chuẩn là những đại lượng đo lường giúp tính tốn được biến thiên của một phân phối

Trang 85

Phương sai

 Phương sai (variance) chính là trung bình của các độ lệch bình phương giữa các giá trị so với giá trị trung bình

Trang 86

Phương sai của dân số

 Công thức đo lường biến thiên của dân số (phương sai)

Trang 87

Phương sai của dân số

 Tính giá trị trung bình của dân số

 Trừ giá trị trung bình cho từng giá trị của dân số (hiệu số)

 Bình phương từng hiệu số

 Cộng các hiệu số được bình phương

 Lấy tổng của các hiệu số bình phương

Trang 88

Phương sai của dân số

 Nếu các giá trị được phân phối một cách dàn trãi trên diện rộng và cách xa trung bình thì độ lệch sẽ lớn và phương sai sẽ rất lớn

 Nếu các giá trị quần tụ gần giá trị trung bình thì độ lệch sẽ nhỏ và phương sai sẽ nhỏ

Trang 89

Phương sai của dân số

 Như vậy, một phương sai lớn có nghĩa là

độ biến thiên của phân phối cũng lớn và ngược lại

Trang 90

Phương sai của mẫu

 Công thức đo lường biến thiên của mẫu (phương sai)

 n-1 gọi là bậc tự do của phương sai

Trang 91

Phương sai của mẫu

 Đối với một phương sai, có n-1 các độ lệch có thể biến đổi một cách tự do một khi chúng đã được nhận biết, độ lệch sau cùng chắc chắn sẽ được xác định

 Vì vậy có n-1 bậc tự do

Trang 92

Độ lệch chuẩn (standard deviation)

 Biểu thị mức độ phân tán (cùng bản chất của tính trạng)

 Độ lệch càng lớn mức độ phân tán càng cao, tính đại diện trung bình càng nhỏ

Trang 93

Độ lệch chuẩn

 Là căn bậc hai của phương sai

 độ lệch chuẩn liên quan đến dân số:

δ

Trang 95

Hệ số biến dị

 So sánh mức độ phân tán của các tính trạng có bản chất khác nhau

%

100

X SD

Trang 96

Mô tả biến thiên

 Mô tả biến thiên chính là đo lường sự khác biệt của các giá trị với một giá trị chuẩn nào đó tức là điểm trung bình

Trang 97

Mô tả biến thiên

Trang 98

Mô tả biến thiên

Trang 99

Mô tả biến thiên

Trang 100

Mô tả biến thiên

 Thông thường làm tròn giá trị của độ lệch chuẩn và phương sai ở chữ số thập phân thứ 2

 Biến thiên càng lớn thì độ lệch chuẩn và phương sai càng lớn

 Khi viết báo cáo kết quả phân tích thống

kê, thường dùng độ lệch chuẩn

Trang 101

Điểm s chu n hoáố ẩ

 Được dùng để đo lường độ lệch của một điểm số nào đĩ khi được so sánh với trung bình bằng độ lệch chuẩn

Trang 102

Điểm s chu n hoáố ẩ

 Chuyển một điểm số nào đĩ thành một điểm số chuẩn hố theo cơng thức:

Trang 103

Điểm s chu n hoáố ẩ

= 1,75

4

7 4

Ngày đăng: 02/08/2014, 02:20

HÌNH ẢNH LIÊN QUAN

Bảng phân phối tần số - baigiang tin hoc xu li so lieu ppt
Bảng ph ân phối tần số (Trang 43)
Sơ đồ tổng quát của bảng phân phối  tần số - baigiang tin hoc xu li so lieu ppt
Sơ đồ t ổng quát của bảng phân phối tần số (Trang 44)
Sơ đồ tổng quát của bảng phân phối  tần số - baigiang tin hoc xu li so lieu ppt
Sơ đồ t ổng quát của bảng phân phối tần số (Trang 46)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w