1.3 Các bước trong nghiên cứu thực phẩm Xác định nhiệm vụ, đối tượng, dân số Tính toán số lượng đơn vị cần thu thập theo qui định thống kê Thu thập dữ kiện Lưu trữ và xử lý số liệ
Trang 1TIN HỌC ỨNG DỤNG TRONG HOÁ HỌC - THỰC PHẨM
Trang 2Mục tiêu
Giúp sinh viên độc lập trong nghiên cứu
khoa học, có khả năng xử lý số liệu thường gặp trong điều tra, nghiên cứu trong hoá học - thực phẩm
Trang bị cho sinh viên kỹ năng sử dụng
phần mềm tin học trong việc giải quyết
xử lý, trình bày số liệu và giải quyết một
số bài toán trong thực phẩm
Trang 3Tài liệu tham khảo
Nguyễn Ngọc Kiểng, Thống kê học trong
nghiên cứu khoa học, NXB Giáo dục, 1996.
Lê Đức Ngọc, Xử lý số liệu và kế hoạch hóa
thực nghiệm, Khoa Hóa, ĐHQGHN, 2001.
Nguyễn Cảnh, Quy hoạch thực nghiệm, NXB
Đại học Quốc gia, 2004
Phan Hiếu Hiền, Phương pháp bố trí nghiệm
Trang 44. Phân tích hồi qui và tương quan
5. Một số bài toán trong công nghệ thực
phẩm
Trang 51 Tin học ứng dụng trong nghiên cứu hoá học thực phẩm
Khoa học thực phẩm
Các dạng nghiên cứu thực phẩm
Các bước trong nghiên cứu thực phẩm
Tin học ứng dụng trong nghiên cứu thực
phẩm
Trang 61.1 Khoa học thực phẩm
Nghiên cứu các tác động qua lại của các
yếu tố ảnh hưởng đến chất lượng thực
phẩm
Kỹ thuật thực phẩm liên quan đến qui
trình, thiết bị, con người, vi sinh vật…
Giải quyết vấn đề: Chất lượng, An toàn,
Kỹ thuật chế biến
Trang 71.2 Các dạng nghiên cứu thực phẩm
Bố trí thí nghiệm bảo quản & chế biến
sản phẩm thực phẩm
Phân tích diễn biến chất lượng qua thời
gian bảo quản
Điều tra các yếu tố vật lý, hóa học, sinh
học ảnh hưởng đến chất lượng sản phẩm, đánh giá hiệu quả của biện pháp xử lý,
khắc phục
Trang 81.3 Các bước trong nghiên cứu thực phẩm
Xác định nhiệm vụ, đối tượng, dân số
Tính toán số lượng đơn vị cần thu thập
theo qui định thống kê
Thu thập dữ kiện
Lưu trữ và xử lý số liệu
Phân tích kết quả và viết báo cáo
Các bước trong nghiên cứu phát triển
sản phẩm thực phẩm mới
Trang 9Xác định nhiệm vụ, đối tượng, dân số
Trước khi tiến hành thu thập dữ kiện,
phải hiểu mình muốn biết gì khi điều tra nghiên cứu
xác định nhiệm vụ là việc hàng đầu
trước khi thu thập dữ kiện
Trang 10Tính toán số lượng đơn vị cần thu thập theo qui định thống kê
Việc xác định dung lượng mẫu cần thiết
cho cuộc điều tra có ảnh hưởng đến kết quả đánh giá và suy diễn kết luận về
quần thể thông qua tập hợp mẫu
Thu thập không đủ số lượng đơn vị cho
mẫu điều tra sẽ làm lệch sự suy diễn, phi khoa học và dẫn đến sự ngộ nhận gây ra những hậu quả không lường được
Trang 11Thu thập dữ kiện
Khi điều tra nghiên cứu, phải thực hiện
việc thu thập dữ kiện
Trong khi thu thập dữ kiện phải thực
hiện việc ghi chép thông qua các bảng ghi số liệu khảo sát
Trang 12Lưu trữ và xử lý số liệu
Hình thức, phương pháp lưu trữ dữ kiện thu
thập ngoài hiện trường hay kết quả phân tích trong phòng thí nghiệm đa dạng tùy theo mục đích điều tra nghiên cứu:
Dưới dạng bảng tính
Dưới dạng cơ sở dữ liệu
Lưu trữ trực tiếp vào phần mềm xử lý
thống kê
Trang 13Phân tích kết quả và viết báo cáo
Một bảng thống kê kết quả chủ yếu gồm
các thành phần sau:
Tựa đề của bảng
Các đầu đề dữ kiện
Nguồn gốc dữ kiện
Trang 14Các bước trong nghiên cứu phát triển sản phẩm thực phẩm mới
Xác định loại sản phẩm
Tìm hiểu quy trình sản xuất
Xây dựng quy trình công nghệ
Thử nghiệm sản xuất quy mô PTN
Mô hình hóa quy trình sản xuất
Nhân rộng quy mô sản xuất
Phát triển sản xuất
Nghiên cứu đánh giá thị trường
Trang 151.4 Tin học ứng dụng trong nghiên cứu thực phẩm
Trong mọi ngành khoa học thực nghiệm:
thực tế
thí nghiệm
Kết quả bằng số:
là giá trị của một biến ngẫu nhiên
phụ thuộc vào nhiều yếu tố
kết quả bằng số
Trang 161.4 Tin học ứng dụng trong nghiên cứu
thực phẩm
Qui luật được:
nghiên cứu trên một tập hợp con (mẫu)
ước lượng cho tổng thể với độ tin cậy
Xử lý số liệu
dữ liệu thô-tính toán, sắp xếp- dữ liệu tinh
làm cơ sở cho việc diễn giải, phân tích thống kê
Trang 171.4 Tin học ứng dụng trong nghiên cứu thực phẩm
Trang 182 Bố trí thí nghiệm trong nghiên cứu
Khái niệm liên quan đến vấn đề thí
nghiệm
Nguyên tắc của bố trí thí nghiệm
Những điều cần tuân thủ khi bố trí thí
nghiệm
Bố trí thí nghiệm
Trang 192.1 Khái niệm liên quan đến vấn đề thí
Trang 202.1.1 Khái niệm cơ bản trong thống kê kết quả nghiên cứu
Một số khái niệm cơ bản
Phương pháp xử lý số liệu ban đầu
Đại lượng trung bình
Các chỉ số biến thiên
Ước lượng và kiểm định giả thiết thống
kê trong nghiên cứu
Trang 21Một số khái niệm cơ bản
Phân tích thống kê
Mô tả dữ kiện
Công cụ của thống kê
Biến số
Trang 22Thống kê là gì?
Các con số tóm lược thông tin định lượng
Phương pháp tính toán để giúp chúng ta tóm lược hoặc khái quát hoá thông tin
Kỹ thuật giúp quyết định vấn đề như phân tích phương sai, tương quan hồi qui, trắc nghiệm, …
Trang 23Giới hạn của thống kê
Sử dụng thống kê phải biết rành về lĩnh vực chuyên môn của người nghiên cứu
Thống kê chỉ là phương tiện, công cụ
Thống kê trình bày những số liệu hoặc hiện tượng rời rạc một cách hệ thống hơn, chứ không nói được bản chất của sự việc
Thống kê không thay thế được cho suy
Trang 24Thống kê mô tả
Là một trong những bước đầu tiên để phân tích vấn đề và thực hiện một quyết định
Gồm các tính toán cơ bản mang tính chất
mô tả như trung bình, phương sai, độ lệch chuẩn, … nhằm tổng kết về kết quả của thí nghiệm
Trang 25Thống kê mô tả
Phương pháp tóm lược thông tin để làm cho chúng trở nên dễ hiểu tức giảm một
số lớn các số liệu phức tạp thành một số nhỏ hơn gồm các giá trị tóm tắt
Mô tả mối quan hệ giữa các biến số
Trang 26Thống kê suy diễn
Khái quát hoá thông tin của một mẫu cho toàn dân số của mẫu tức là chỉ đo đếm trên một tiểu tập hợp rồi suy luận cho toàn bộ với một độ tin cậy nào đó
Cung cấp kỹ thuật để kiểm tra trên một mẫu và sử dụng thông tin này để suy rộng ra các đặc tính của toàn bộ dân số
Trang 27Mô tả dữ kiện
Hai biến số có giá trị trung bình như
nhau nhưng độ phân tán không giống nhau
độ phân tán cho biết thông tin để đánh
giá độ tin cậy của giá trị tập trung
Trang 28Mô tả dữ kiện
Phân phối dân số
Phân phối mẫu
Phân phối chuẩn
Trang 29Phân phối dân số
là phân phối của những điểm số trong một dân số
Trang 30Phân phối mẫu
là phân phối của những điểm số trong một mẫu có kích cỡ nhất định
là phân phối của một thống kê nào đó của tất cả các mẫu có cùng một kích cỡ trong dân số
Trang 31Phân phối chuẩn
Khi vẽ biểu đồ tương quan giữa tần số và kết quả thu nhận, hình dạng đường cong thông thường có dạng hình chuông gọi là phân phối chuẩn
Trang 32Phân phối chuẩn
Là một phân phối đối xứng có dạng hình chuông, biểu diễn bằng phương trình:
π δ
δ µ
2
2
2 / 2 )
( −
−
Y
Trang 33 Hai phân phối chuẩn với độ lệch chuẩn khác nhau:
độ lệch chuẩn nhỏ cho phép khái quát hoá những kết quả của mẫu cho toàn dân số
Trang 34Phân phối chuẩn
Trang 35Phân phối chuẩn
Trong một phân phối chuẩn, khoảng:
68% số liệu trong khoảng X ±SD
95% số liệu trong khoảng X ±2SD
99% số liệu trong khoảng X ±3SD
Trang 36Phân phối chuẩn
Có 95% số trường hợp nằm trong độ lệch chuẩn ±1,96 so với giá trị trung bình
Có 99% số trường hợp nằm trong độ lệch chuẩn ±2,58 so với giá trị trung bình
Trang 37Các đặc trưng thống kê thường dùng trong mô tả dữ kiện
Các giá trị của một biến số có sự phân phối
là phân tán hay tập trung
Giá trị đồng nhất (các giá trị của một biến
số có xu hướng quần tụ)
Giá trị không đồng nhất (các giá trị của một biến số có xu hướng phân tán)
Trang 38Các đặc trưng thống kê thường dùng trong mô tả dữ kiện
Trung bình mẫu ước lượng giá trị trung tâm của phân bố
Độ lệch chuẩn của mẫu liên quan đến sự phân tán của số liệu
Trang 39Các đặc trưng thống kê thường dùng trong mô tả dữ kiện
Trung bình mẫu và Độ lệch chuẩn chỉ có giá trị đại diện cho mẫu khi mẫu có phân phối chuẩn
Độ lệch (skewness) và độ nhọn (kurtosis) dùng để kiểm tra mẫu có phân bố chuẩn hay không
Trang 40 Độ lệch < 0 (các giá trị có xu hướng tập trung về phía bên trái của đồ thị)
Trang 41 Độ nhọn < 0 (phân bố có đồ thị bẹt hơn phân bố chuẩn)
Trang 42Công cụ của thống kê
Biểu bảng,
Biểu đồ,
Các giá trị mô tả (trung bình, độ lệch chuẩn, phương sai, …)
Trang 43Bảng phân phối tần số
Sắp xếp, trình bày dữ liệu một cách có hệ thống
Phân chia dữ liệu thành từng nhóm khác nhau
Căn cứ để hình thành biểu đồ phân phối tần số
Trang 44Sơ đồ tổng quát của bảng phân phối tần số
Trị số của biến
(Xi)
Tần số (số lần xuất hiện của trị số - fi)
Trang 45Sơ đồ tổng quát của bảng phân phối tần số
Trang 46Sơ đồ tổng quát của bảng phân phối tần số
Năng
suất Tần số Tần số tương
đối (%)
Tần số tích lũy
Tần số tương đối tích lũy
Trang 47Trị số của biến quan sát
Số cụ thể
Khoảng giá trị (khoảng cách có thể bằng nhau hoặc không, có giới hạn trên/dưới hoặc chỉ một giới hạn)
Trang 48Biểu đồ trong thống kê
Biểu diễn toàn bộ số liệu
Thể hiện nét đặc trưng của tập hợp số liệu
Biểu diễn mối quan hệ giữa tính trạng nghiên cứu và chỉ tiêu theo dõi
Trang 49Biểu đồ phân phối tần số
Biểu đồ cột
Trình bày số quan sát lớn
Có thể trình bày tần số tương đối, tần số tích lũy, tần số tương đối tích lũy
Trang 50Biểu đồ phân phối tần số
Trang 51Biểu đồ phân phối tần số
Trang 52Biểu đồ tần số tích lũy
Trang 53Biểu đồ tần số tương đối tích lũy
Trang 54Biểu đồ hộp
Khảo sát sơ lược dữ liệu
Tổng quát về phân phối của mẫu/ tổng thể
thể hiện ví trí tập trung, phân tán, bất thường
Trang 55Biểu đồ hộp
Trang 56Biểu đồ hộp
Khối hộp ‘box’ kéo dài từ giá trị phân vị
¼ đến giá trị phân vị ¾ , khoảng 50% giá trị nẳm trong ‘box’
Đường thẳng đứng ở vị trí trung bị mẫu, chia dãy số liệu thành 2 phần bằng nhau, nếu mẫu phân bố đối xứng thì đường này nằm gần trung tâm của khối hộp
Trang 57Biểu đồ hộp
Dấu + ở vị trí trung bình của mẫu
Sự khác biệt đáng kể giữa trung bình và trung vị cho thấy có một vài số liệu có khả năng gây ra sai số làm phân bố của mẫu bị lệch
Đoạn thẳng hai đầu gọi là ‘whisker’ nối
từ giá trị cực tiểu đến điểm phân vị ¼ và
Trang 58Biểu đồ điểm
Trang 60Mẫu (sample)
Được chọn ngẫu nhiên từ dân số
Mẫu là một phần và là đại diện của dân số
Phân tích mẫu có thể suy ra các đặc tính của dân số với một mức độ tin cậy xác định nào đó
Trang 61Mẫu ngẫu nhiên
Mẫu lấy từ dân số mà các đơn vị đều có
cơ hội đồng đều nhau, nó mang tính khách quan trong thu thập dữ kiện
Trang 62Dân số (population)
Là tập hợp những thông tin về người, sự vật hoặc sự việc riêng biệt kết hợp với
nhau trên cơ sở một đặc điểm chung nào
đó mà người nghiên cứu đang quan tâm
Là tập hợp toàn bộ các đối tượng nghiên cứu, điều tra, khảo sát Có những đặc
điểm chung vào mục tiêu của điều tra
nghiên cứu môi trường
Trang 63Dân số
Thường rất lớn và không thể kiểm tra hết
Muốn biết thông tin về dân số chỉ có thể
đo đếm trên một tiểu tập hợp gọi là mẫu
Trang 65Biến số liên tục
Là các số nguyên dương và thập phân
Các số đo về chiều dài, trọng lượng, thể tích,
Trang 67Đơn vị
đối tượng cụ thể để đo đếm và thu nhập
dữ kiện
Một mẫu thăm dò sẽ có nhiều đơn vị
Đơn vị thống kê là một phần tử của một tập hợp mẫu thống kê điều tra khảo sát
Cần phân biệt giữa đơn vị thống kê và
hình thức thu thập mẫu trong trường hợp
Trang 68Phương pháp xử lý số liệu ban đầu
Gọi a là trị thực của đại lượng đo, X là
kết quả đo
Sai số tuyệt đối (X-a) có thể gồm 3
thành phần là sai số hệ thống, sai số thô, sai số ngẫu nhiên
Trang 69Sai số hệ thống
Sai số hệ thống là sai số không đổi hoặc
thay đổi theo một qui luật nhất định
Sai số hệ thống có thể hiệu chỉnh được
Trang 70Sai số thô
Sai số thô là sai số do bất cẩn, trục trặc
kỹ thuật, thay đổi điều kiện đột ngột, …Đặc điểm đơn lẻ, có trị số tuyệt đối lớn hoặc nhỏ một cách bất thường
Cần loại bỏ các số đo chứa sai số thô để
khỏi ảnh hưởng không trung thực đến
kết quả chung
Trang 71Sai số ngẫu nhiên
Sai số ngẫu nhiên là sai số không thể
tiên đoán được cụ thể, do rất nhiều nhân
tố có tác dụng nhỏ không thể tách riêng hoặc tính riêng
Sai số ngẫu nhiên là sai số mà người làm
thí nghiệm không thể loại bỏ được, phải chấp nhận
Trang 72Đại lượng trung bình
Trang 74Mode: (Mo)
Biến số đơn thức là biến số khi gần như mọi trường hợp đều tập trung về một giá trị
Biến số nhị thức là biến số khi gần như có hai hay nhiều trường hợp nhất và gần như tương đương nhau
Trang 76X
Trang 77Trung bình cộng
Đại diện cho cả một tập hợp lớn số liệu
Nêu lên đặc điểm chung nhất của hiện tượng
Dùng để so sánh các hiện tượng không có cùng qui mô
X
Trang 78Trung bình cộng số học
n
X X
n i
i
∑
=
= 1
Trang 79Trung bình có trọng số
Là trường hợp đặc biệt của trung bình số học khi gía trị của biến xuất hiện nhiều lần
i i
f
f
X X
1 1
Trang 80Trung bình của dữ liệu phân nhóm có khoảng cách
i i
f
f
m X
1 1
Trang 81Trung bình nhân (trung bình hình học)
GM
Căn bậc n cho n giá trị
Thay cho trung bình cộng trong trường hợp dãy số liệu có phân phối lệch (giá trị đột biến)
n
n
X X
X
GM = 1 2
Trang 83Các chỉ số biến thiên
Đại lượng đo lường độ biến thiên
Mô tả biến thiên
Điểm số chuẩn hoá
Sai biệt chuẩn
Khoảng tin cậy
Trang 84Đại lượng đo lường độ biến thiên
Phương pháp đo lường độ biến thiên của các phân phối giúp hiểu rõ phân phối
Phương sai và độ lệch chuẩn là những đại lượng đo lường giúp tính tốn được biến thiên của một phân phối
Trang 85Phương sai
Phương sai (variance) chính là trung bình của các độ lệch bình phương giữa các giá trị so với giá trị trung bình
Trang 86Phương sai của dân số
Công thức đo lường biến thiên của dân số (phương sai)
Trang 87Phương sai của dân số
Tính giá trị trung bình của dân số
Trừ giá trị trung bình cho từng giá trị của dân số (hiệu số)
Bình phương từng hiệu số
Cộng các hiệu số được bình phương
Lấy tổng của các hiệu số bình phương
Trang 88Phương sai của dân số
Nếu các giá trị được phân phối một cách dàn trãi trên diện rộng và cách xa trung bình thì độ lệch sẽ lớn và phương sai sẽ rất lớn
Nếu các giá trị quần tụ gần giá trị trung bình thì độ lệch sẽ nhỏ và phương sai sẽ nhỏ
Trang 89Phương sai của dân số
Như vậy, một phương sai lớn có nghĩa là
độ biến thiên của phân phối cũng lớn và ngược lại
Trang 90Phương sai của mẫu
Công thức đo lường biến thiên của mẫu (phương sai)
n-1 gọi là bậc tự do của phương sai
Trang 91Phương sai của mẫu
Đối với một phương sai, có n-1 các độ lệch có thể biến đổi một cách tự do một khi chúng đã được nhận biết, độ lệch sau cùng chắc chắn sẽ được xác định
Vì vậy có n-1 bậc tự do
Trang 92Độ lệch chuẩn (standard deviation)
Biểu thị mức độ phân tán (cùng bản chất của tính trạng)
Độ lệch càng lớn mức độ phân tán càng cao, tính đại diện trung bình càng nhỏ
Trang 93Độ lệch chuẩn
Là căn bậc hai của phương sai
độ lệch chuẩn liên quan đến dân số:
δ
Trang 95Hệ số biến dị
So sánh mức độ phân tán của các tính trạng có bản chất khác nhau
%
100
X SD
Trang 96Mô tả biến thiên
Mô tả biến thiên chính là đo lường sự khác biệt của các giá trị với một giá trị chuẩn nào đó tức là điểm trung bình
Trang 97Mô tả biến thiên
Trang 98Mô tả biến thiên
Trang 99Mô tả biến thiên
Trang 100Mô tả biến thiên
Thông thường làm tròn giá trị của độ lệch chuẩn và phương sai ở chữ số thập phân thứ 2
Biến thiên càng lớn thì độ lệch chuẩn và phương sai càng lớn
Khi viết báo cáo kết quả phân tích thống
kê, thường dùng độ lệch chuẩn
Trang 101Điểm s chu n hoáố ẩ
Được dùng để đo lường độ lệch của một điểm số nào đĩ khi được so sánh với trung bình bằng độ lệch chuẩn
Trang 102Điểm s chu n hoáố ẩ
Chuyển một điểm số nào đĩ thành một điểm số chuẩn hố theo cơng thức:
Trang 103Điểm s chu n hoáố ẩ
= 1,75
4
7 4