Danh mục vấn đề của học phần1.Thu thập và trình bày số liệu 2.Ước lượng và kiểm định giả thuyết 3.Phân tëch phương sai ANOVA 4.Phân tëch tương quan và hồi quy 5.Thiết kế thë nghiệm thăm
Trang 1BÀI GIẢNG THIẾT KẾ VÀ PHÂN TÍCH
THÍ NGHIỆM
Số tën chỉ: 02 CBGD: Đặng Thị Thu Hương
Trang 2Danh mục vấn đề của học phần
1.Thu thập và trình bày số liệu
2.Ước lượng và kiểm định giả thuyết
3.Phân tëch phương sai (ANOVA)
4.Phân tëch tương quan và hồi quy
5.Thiết kế thë nghiệm thăm dò độ biến động
6.Thiết kế thë nghiệm và thăm dò và khai thác mặt đáp (RSM)
Trang 3Vấn đề 1
Thu thập và trình bày số liệu
Kiến thức
1 Tổng thê va mẫu trong thë nghiệm
2 Thu thập số liệu, sai sô va cách xư ly
3 Trình bày số liệu
4 Đại lượng thống kê tóm lược
Trang 4Vấn đề 1
Thu thập và trình bày số liệu
Kỹ năng
1 Xác định được phương pháp lấy mẫu hợp lý
2 Xác định được các sô liệu bất thường va cách loại
bo
3 Biết trình bày sô liệu thô và số liệu đã xử lý
4 Tënh toán được các đại lượng thống kê tóm lược
5 Sử dụng được một phần mềm để hỗ trợ thực hiện
các phép tënh nói trên
Trang 62 Xác định được këch thước mẫu hợp ly
3.Thực hiện được thủ tục kiểm định giả thiết về giá trị
trung bình 4.Thực hiện được thủ tục so sánh 2 phương sai
5.Thực hiện được thủ tục so sánh 2 giá trị trung bình
6 Sử dụng được một phần mềm để hỗ trợ các phép
Trang 7Vấn đề 3 Phân tëch phương sai (ANOVA)
Kiến thức
1 Phân tëch phương sai 1 yếu tố
2 Phân tëch phương sai 2 yếu tố
3 Phân tëch sâu ANOVA (So sánh nhiều giá trịtrung bình cùng lúc)
Trang 8Vấn đề 3 Phân tëch phương sai (ANOVA)
Kỹ năng
1 Thực hiện được thu tục phân tëch phương sai
2 Sử dụng được một phần mềm để hỗ trợ thựchiện các phép toán nói trên
Trang 9Vấn đề 4 Phân tëch tương quan và hồi quy
Kiến thức
1 Phân tëch tương quan
2 Phân tëch hồi quy tuyến tënh đơn
3 Phân tëch hồi qui tuyến tënh bội
Trang 10Vấn đề 4
Phân tëch tương quan và hồi quy
Kỹ năng
1.Thực hiện được thủ tục phân tëch tương
quan va hồi quy2.Sử dụng được một phần mềm để hỗ trợ cho
việc tënh toán trong phân tëch tương quan
va hồi quy
Trang 11Vấn đề 5:
Thiết kế thë nghiệm thăm dò độ biến
động
Kiến thức
1 Thiết kế ngẫu nhiên hoàn toàn (CRD)
2 Thiết kế khối ngẫu nhiên đầy đủ (RCB)
3 Thiết kế ô vuông Latinh
4 Thiết kế lô phân cấp (Split – Plot – Design)
Trang 12Vấn đề 5 Thiết kế thë nghiệm thăm dò độ biến
động
Kỹ năng
1 Lựa chọn được mô hình thiết kế phù hợp
theo mục đëch nghiên cứu
2 Phân tëch được số liệu và trình bày kết quả
theo mô hình đã thiết kế
3 Sử dụng được một phần mềm để hỗ trợ cho
việc phân tëch số liệu theo mô hình đã thiết kế
Trang 14Vấn đề 6
Thiết kế thë nghiệm thăm dò và
khai thác mặt đáp (RSM)
Kỹ năng
1 Lựa chọn được mô hình thiết kế phù hợp
theo mục đëch nghiên cứu
2 Phân tëch số liệu và trình bày kết quả theo
mô hình đã thiết kế
3 Sử dụng được một phần mềm để hỗ trợ cho
việc thiết kế và phân tëch thë nghiệm
Trang 16HÌNH THỨC ĐÁNH GIÁ
- Đi học chuyên cần: 5%
- Tham gia phát biểu, làm bài tập về nhà: 10%
- Kiểm tra: Thi viết, đề mở: 10%
- Thực hành trên phần mềm theo nhóm: 25%
- Hình thức thi: Thi viết, đề mở 50%
Trang 18TÀI LIỆU THAM KHẢO
I TIẾNG VIỆT
1 Nguyễn Cảnh Quy hoạch thực nghiệm.Trường đại học bách khoa Tp HCM 2004.
2 Nguyễn Cảnh- Nguyễn Đình Soa Tối ưu hoá thực nghiệm trong hoá
học và kỹ thuật hoá học.Tài liệu dịch- Trường đại học kỹ thuật Tp Hồ
Chë minh 1994.
3 Phạm Hiếu Hiền Phương pháp bố trë thë nghiệm và xử lý số liệu NXB nông nghiệp - Tp Hồ Chë Minh 2001.
4 Phạm Văn Lang- Bạch Quốc Khang Cơ sở lý thuyết quy hoạch thực
nghiệm và ứng dụng trong kỹ thuật nông nghiệp NXB nông
Trang 19TÀI LIỆU THAM KHẢO
II TIẾNG ANH
1 W Michael Kelly and Robert A Donnelly Jr.2009
The humongous book of statistic problems
2 D Brynn Hibbert and J Justin Gooding 2006 Data Analysis for Chemistry
3 John A Bower 2009 Statistical Methods for Food
Trang 20Vấn đề 1
Thu thập và trình bày số liệu
Kiến thức
1 Tổng thê va mẫu trong thë nghiệm
2 Thu thập số liệu, sai sô va cách xư ly
3 Trình bày số liệu
4 Đại lượng thống kê tóm lược
Trang 21Vấn đề 1
Thu thập và trình bày số liệu
Kỹ năng
1 Xác định được phương pháp lấy mẫu hợp lý
2 Xác định được các sô liệu bất thường va cách loại
bo
3 Biết trình bày sô liệu thô và số liệu đã xử lý
4 Tënh toán được các đại lượng thống kê tóm lược
Trang 22 Mẫu:
Từ tổng thể N phần tử chọn ra một tập hợp con n phần tử và chỉ tập trung nghiên cứu n phần tử đó để rút ra những kết luận về tổng thể thì tập hợp con đó được gọi là mẫu Số phần tử của mẫu được gọi
là këch thước mẫu, ký hiệu n
Các thë nghiệm được tiến hành trên mẫu, kết quả thu được qua xử lý
Trang 23Vấn đề 1
T ng thê va mẫu trong thë nghiệm
Tại sao nghiên cứu trên mẫu
- Quy mô của tập hợp quá lớn, việc nghiên cứu toàn bộ sẽ đòi hỏi nhiều chi phë vật chất và thời gian
- Quy mô của tập hợp quá lớn vì vậy có thể xảy ra trường hợp tënh trùng hoặc bỏ sót các phần tử của nó.
- Quy mô nghiên cứu lớn nhưng trình độ tổ chức nghiên cứu lại hạn chế dẫn đến sai sót trong quá trình thu thập thông tin ban đầu, do đó hạn
Trang 24Vấn đề 1
T ng thê va mẫu trong thë nghiệm
Các phương pháp chọn mẫu:
- Ch ọn mẫu ngẫu nhiên đơn giản
- Chọn mẫu ngẫu nhiên phân tầng
- Chọn mẫu ngẫu nhiên hệ thống
- Chọn mẫu cụm (không gian)
Trang 25Vấn đề 1 Thu thập số liệu, sai sô va cách xư ly
Các phương pháp thu thập số liệu:
- Thu thập số liệu bằng cách tham khảo tài liệu.
- Thu thập số liệu từ những thực nghiệm (các thë nghiệm trong phòng, ngoài thực địa)
- Thu thập số liệu phi thực nghiệm (lập bảng
Trang 26Vấn đề 1 Thu thập số liệu, sai sô va cách xư ly
Các loại sai số khi thu thập số liệu?
- Sai số thô: Loại sai số này không được chấp
nhận trong thống kê, vì vậy phải đựơc loạibỏ
- Sai số hệ thống: Trong thống kê có thể chấp
nhận loại sai số này nhưng phải được hiệuchỉnh trước khi tënh toán thống kê
- Sai số ngẫu nhiên
Trang 27Vấn đề 1 Trình bày số liệu
Cách trình bày số liệu
* Bảng
- Bảng phân phối thu gọn (a)
- Bảng phân phối ghép lớp (b)
Trang 28Vấn đề 1 Trình bày số liệu
(a) Bảng phân phối thu gọn
- Số liệu rời rạc,nhiều giá trị lặp lại
(b) Bảng phân phối ghép lớp
- Këch thước mẫu lớn
- Số liệu liên tục, số lần lặp lại có thể nhiều
hoặc ët
Trang 29Vấn đề 1 Trình bày số liệu
Biểu đồ
(không có liên hệ hàm giữa hai đại lượng quan sát)
- Hình quạt (tỷ lệ %)
- Hình cột (các mẫu riêng biệt)
- Đường gấp khúc (cùng một mẫu quan sát)
Trang 30Vấn đề 1 Trình bày số liệu
Trang 31Vấn đề 1 Đại lượng thống kê tóm lược
Đại lượng thống kê tóm lược
- Trung bình (Mean)
- Trung vị (Median)
- Số trội (Mode)
Trang 32Vấn đề 1 Đại lượng thống kê tóm lược
- Phương sai mẫu (Sample Variance)
- Độ lệch chuẩn (Standard Deviation)
- Khoảng biến thiên (Range)
- Sai số chuẩn của GTTB (Standard Error)
Trang 33Vấn đề 1 Đại lượng thống kê tóm lược
- Giá trị KURT (Kurtosis)
- Gëa trị SKEW (Skewness)
- Min, Max
- Tổng (Sum)
- Số giá trị quan sát – këch thước mẫu (Count)
Trang 35Vấn đề 2 Ước lượng và kiểm định giả thuyết
Trang 36Vấn đề 2 Ước lượng và kiểm định giả thuyết
Kỹ năng
1 Thực hiện được thu tục ước lượng khoảng tin cậy cho giá trị trung bình
2 Xác định được këch thước mẫu hợp ly
3.Thực hiện được thủ tục kiểm định giả thiết về giá trị
trung bình 4.Thực hiện được thủ tục so sánh 2 phương sai
5.Thực hiện được thủ tục so sánh 2 giá trị trung bình
6 Sử dụng được một phần mềm để hỗ trợ các phép
Trang 37Vấn đề 2 Ước lượng và kiểm định giả thuyết
Mức ý nghĩa ()
Độ tin cậy (1- )
Một số hàm phân phối thông dụng
- Phân phối chuẩn hóa
- Phân phối Student
Trang 38- Tham số của tổng thể
- Thống kê của mẫu
- Ước lượng
- Ước lượng điểm
- Ước lượng khoảng
Vấn đề 2 Ước lượng và kiểm định giả thuyết
Trang 39Vấn đề 2
Ước lượng khoảng tin cậy cho giá trị
trung bình
Bài toán ước lượng giá trị trung bình
- Phương sai đã biết
- Phương sai chưa biết (mẫu lớn)
Trang 40SỬ DỤNG SPSS
Analyze Descriptive Statistic Explore
Trang 41BT5 Descriptives
41.2881 3.63035 34.0212
48.5551
38.1403 33.0000 777.588 27.88526
7.00 147.00
Mean
Lower Bound Upper Bound
95% Confidence Interval for Mean
5% Trimmed Mean Median
Variance Std Deviation Minimum
Maximum VAR00002
Statistic Std Error
Trang 42BT 8
Descriptives
52.2250 2.40384 47.3991
57.0509
52.7325 54.0500 300.480 17.33437 17.50 78.50 61.00 27.63 -.436 330
Mean
Lower Bound Upper Bound
95% Confidence Interval for Mean
5% Trimmed Mean Median
Variance Std Deviation Minimum
Maximum Range Interquartile Range Skewness
VAR00003
Statistic Std Error
Trang 43Vấn đề 2 Xác định këch thước mẫu để ước
lượng cho giá trị trung bình
Xác định këch thước mẫu
Trang 44Vấn đề 2 Kiểm định gia thuyết về giá trị trung bình
Bài toán kiểm định
- Kiểm định về giá trị trung bình
- Phương sai đã biết
- Phương sai chưa biết
+ mẫu lớn+ mẫu nhỏ
Trang 45Vấn đề 2 Kiểm định gia thuyết về giá trị trung bình
- Phân tëch bài toán Xác định dạng thủ tục
thống kê
- Xác định đại lượng thống kê
- Thực hiện thủ tục
- Đưa ra kết luận
Trang 46Vấn đề 2
So sánh 2 phương sai
Áp dụng khi cần đánh giá độ chënh xác của 2 phương pháp phân tëch
Trang 47Bài 19
Phân tëch bài toán
- Để biết phương pháp đo nào chënh xáchơn,ta sẽ so sánh 2 phương sai
- Nếu phương sai của 2 phương pháp là khácnhau thì phương pháp nào có phương sainhỏ, phương pháp đó sẽ chënh xác
Trang 49 Phân tëch bài toán
- Để biết phương pháp đo nào chënh xáchơn,ta sẽ so sánh 2 phương sai
- Nếu phương sai của 2 phương pháp là khácnhau thì phương pháp nào có phương sainhỏ, phương pháp đó sẽ chënh xác
TD11/59
Trang 51 Để xác định xem phương pháp đo nào chënh xác hơn cần phải so sánh 2 phương sai, nếu phương sai của 2 phương pháp là khác nhau thì phương pháp nào có phương sai nhỏ phương pháp đó sẽ chënh xác hơn
Dùng excel để xử lý số liệu: áp dụng “F Test
Phân tëch TD11 và xác định chương trình phân tëch dữ liệu cần áp dụng trong excel
Trang 52SỬ DỤNG EXCEL
Trang 53SỬ DỤNG EXCEL
Trang 54SỬ DỤNG EXCEL
Trang 55Vấn đề 2
So sánh 2 giá trị trung bình
Phân tëch bài toán
Xác định xem bài toán thuộc trường hợp nào trong 5 trường hợp sau:
- Dữ liệu tương ứng từng cặp (a)
- Phương sai đã biết (b)
- Phương sai chưa biết
+ mẫu lớn (c) + mẫu nhỏ, đồng phương sai (d) + mẫu nhỏ, dị phương sai (e)
Trang 56 Đây là bài toán so sánh 2 gttb thuộc trường hợp
dữ liệu tương ứng từng cặp, do đó ta áp dụng
“t-Test: Paired Two Sample for Means”
Phân tëch TD7 và xác định chương trình phân
tëch dữ liệu cần áp dụng trong excel
Trang 57SỬ DỤNG EXCEL
Trang 58SỬ DỤNG EXCEL
Trang 59SỬ DỤNG EXCEL
Trang 63Phân tëch phương sai
- Phân tëch phương sai một yếu tố
(ANOVA –Single factor) – EXCEL
One way ANOVA - SPSS
- Phân tëch phương sai 2 yếu tố không lặp (ANOVA –
Two factors without Replication)
Trang 64Phân tëch phương sai một yếu tố
(ANOVA ÁSingle factor)
Mô hình thë nghiệm
Trang 65Phân tëch phương sai một yếu tố
(ANOVA ÁSingle factor)
Bảng ANOVA
Trang 66Phân tëch phương sai một yếu tố
(ANOVA ÁSingle factor)
Các giá trị trung bình bằng nhau yếu tố không tác động
(không ảnh hưởng) đến giá trị quan sát.
+ F * > F (, k-1, n-k): Bác bỏ H 0
Tồn tại ët nhất một cặp giá trị trung bình khác nhau
Trang 67Vë dụ: Chiết alcaloid từ một loại dược liệu thuhái từ 3 vùng khác nhau, kết quả thu được nhưsau
Hãy cho biết hàm lượng alcaloid có khác
Trang 68Muốn biết hàm lượng alcaloid có khác nhau theovùng hay không ta phải so sánh hàm lượngalcaloid trung bình giữa các vùng với nhau
- Giá trị quan sát: hàm lượng alcaloid
- Yếu tố: 1 yếu tố (vùng trồng), có 3 vùng (k=3)
Phân tëch phương sai một yếu tố
(ANOVA –Single factor) – excel
One way anova - spss
TD12/65
Phân tëch bài toán
Trang 69- Gọi 1 , 2 , 3 lần lượt là hàm lượng alcaloid
trung bình tương ứng với 3 vùng
Trang 7017 6.831111
Total
0.100276 15
5.326968
Between
Groups
F crit P-value
F MS
df SS
Source of
Variation
ANOVA
Trang 71F * = 26,5615; F crit = 3,68
P value = 1,18E-05; =0,05
Ta thấy
F* > Fcrit hay Pvalue <0,05, do đó bác bỏ giả
thuyết H0, chấp nhận Ha hay hàm lượng alcaloid khác nhau theo vùng.
TD12/65
Đọc kết quả
Trang 72Phân tëch phương sai 2 yếu tố không lặp
(ANOVA –Two factors without Replication)
Mô hình thë nghiệm
Trang 73Phân tëch phương sai 2 yếu tố không lặp
(ANOVA –Two factors without Replication)
Trang 74Phân tëch phương sai 2 yếu tố không lặp
(ANOVA –Two factors without Replication)
Trang 75Phân tëch phương sai 2 yếu tố không lặp
(ANOVA –Two factors without Replication)
Trang 76Vë dụ: Hàm lượng flavonoid trong cùng một mẫudược liệu được chiết xuất bởi 5 phương pháp với
5 loại dung môi khác nhau được ghi lại như sau
Hãy cho biết phương pháp hay dung môi có ảnh hưởng đến kết quả của sựchiết xuất hay không?
Trang 77Muốn biết phương pháp hay dung môi có ảnhhưởng đến kết quả của sự chiết suất (hàmlượng flavonoid) hay không ta phải:
- So sánh hàm lượng flavonoid trung bình thuđược từ các loại dung môi với nhau
So sánh hàm lượng flavonoid trung bình thu
TD13/68
Phân tëch bài toán
Trang 78- Giá trị quan sát: hàm lượng flavonoid
- Yếu tố: 2 yếu tố
- Yếu tố hàng: phương pháp, có 5 phương pháp (r=5)
- Yếu tố cột: dung môi, có 5 dung môi (c=5)
Phân tëch phương sai 2 yếu tố không lặp
(ANOVA –Two factors without Replication )
TD13/68
Phân tëch bài toán
Trang 79Yếu tố hàng(phương pháp chiết)
- Đặt cấu trúc
Thực hiện thủ tục
TD13/68
Trang 80Yếu tố cột (dung môi)
Trang 81Xử lý số liệu
TD13/68
3.007 8.5E-05
12.47
46.39 4
185.6
Columns
3.007 0.59241
0.717
2.668 4
10.67
Rows
F crit P-value
F MS
df SS
Source of Variation
ANOVA
Trang 82Yếu tố hàng (Rows)
F *
r = 0,717 Fcrit = 3,007
Phương pháp chiết không ảnh hưởng tới kết quả của
sự chiết dược liệu
Đọc kết quả
TD13/68
Trang 83Yếu tố cột (Columns)
F *
r = 12.47 Fcrit = 3,007
P-value = 8.5E-05
Ta thấy
F *
c > Fcrit hay P-value<0,05, do đó bác bỏ giả thuyết H0,
hay hàm lượng flavonoid khác nhau theo các dung môi chiết
Đọc kết quả
TD13/68
Trang 84Phân tëch phương sai 2 yếu tố có lặp (ANOVA
–Two factors with Replication)
Mô hình thë nghiệm tương tự PTPS 2YT không lặp nhưng ứng với
Trang 85Phân tëch phương sai 2 yếu tố có lặp
(ANOVA –Two factors with Replication)
Trang 86Phân tëch phương sai 2 yếu tố có lặp
(ANOVA –Two factors with Replication)
Trang 87Phân tëch sâu ANOVA
(So sánh nhiều giá trị trung bình cùng lúc)
Thủ tục phân tëch phương sai cho chúng ta biết được có hay không sự ảnh hưởng của yếu tố đến giá trị quan sát (có hay không sự khác biệt giữa các cặp giá trị trung bình)
Nếu có sự khác biệt thì việc kế tiếp là chúng ta phải tìm ra sự khác biệt đó thể hiện ở những cặp giá trị
Trang 88Trong trường hợp muốn so sánh nhiều cặp giá trị trung bình, nếu ta tiến hành lặp lại việc so sánh luân phiên từng cặp bằng cách thực hiện riêng lẻ các bài toán so sánh 2 giá trị trung bình thì sẽ rất bất tiện vì:
- số lần so sánh nhiều, q =k!/[2!(k-2)!]
- khả năng phạm sai lầm tăng lên theo mỗi lần so sánh
Dùng các phép so sánh đồng thời để giảm sai lầm, thủ tục so sánh diễn ra nhanh chóng.
So sánh nhiều giá trị trung bình ( 3)
Trang 89Nếu phương sai của các lô mẫu là đồng nhất, dùng các phép so sánh sau:
@1 Phương pháp LSD (Least Significant Difference)
@2 Phương pháp Duncan (Duncan’s Multiple Range Test)
@3 Phương pháp Scheffé
Xác định chỗ khác biệt
(PHÂN TÍCH SÂU ANOVA)
Trang 90Nếu phương sai của các lô mẫu là khác nhau, dùng các phép so sánh sau
Trang 92HƯỚNG DẪN SỬ DỤNG SPSS
Mở giao diện SPSS
Khai báo dữ liệu
của biến: chọn Data
View – khai báo dữ
liệu của biến theo
cột
Trang 93HƯỚNG DẪN SỬ DỤNG SPSS
Thực hiện phân tëch dữliệu:
Chọn Analyze Compare Means One
way ANOVA
Trang 94HƯỚNG DẪN SỬ DỤNG SPSS
Trong hộp thoạikhai báo yếu tố
và biến phụthuộc (giá trịquan sát)
Trang 96HƯỚNG DẪN SỬ DỤNG SPSS
Trang 97HƯỚNG DẪN SỬ DỤNG SPSS
Nhìn vào giá trị Sig trong bảng
khác biệt các giá trị trung bình:
Sig : có sự khác biệt tiếp tục
Trang 98HƯỚNG DẪN SỬ DỤNG SPSS
- Nhìn vào giá Sig trong bảng
phương sai giữa các nhóm
Trang 99HƯỚNG DẪN SỬ DỤNG SPSS
- Sig : không có sự khác biệt về phương sai chọn nhóm test (LSD; Duncan; Scheffé; Tukey; Bonferroni; …) cho phần phân tëch
sự khác biệt giữa các giá trị trung
Trang 102HƯỚNG DẪN SỬ DỤNG SPSS