PHẦN I: THỐNG KÊ VÀ PHÂN TÍCH THỐNG KÊ SỐ ĐO Chương 1: Các đặc trưng thông kê của một tập số liệu kết quả đo. 1.Các tham số đặc trưng về sự tập trung của tập số liệu. 1.1.Tần xuất (pi) 1.2.Số trội (Mo). 1.3.Khoảng của tập số (R) 1.4.Số trung vị (Med) và số tứ phân vị (Q). 1.5.Trung bình cộng(X). 2.Các tham số đặc trưng về sự phân tán của tập số liệu. 2.1.Phương sai (σ2 hoặc S2). 2.2.Độ lệch chuẩn (σ f hoặc Sf).
Trang 2Chương 1: Các đặc trưng thông kê của một tập số liệu kết quả đo
1.Các tham số đặc trưng về sự tập trung của tập số liệu
2.Các tham số đặc trưng về sự phân tán của tập số liệu
2.1.Phương sai (σ2 hoặc S2)
2.2.Độ lệch chuẩn (σ f hoặc Sf)
2.3.Độ sai chuẩn (σx hoặc Sx)
2.4.Hệ số biến thiên (Cv)
3.Các đặc trưng phân phối thống kê của tập số liệu
3.1.Phân phối Chuẩn (phân phối Gauss)( u )
3.2.Phân phối Student (phân phối t)
3.3.Phân phối Fisher
3.4.Phân phối Khi bình phương
3.5.Phân phối Poisson
3.6.Phân phối Nhị thức
3.7.Mối quan hệ giữa các hàm phân phối và các chuẩn phân phối
Chương 2 :Phân tích đánh giá tập số liệu kết quả đo
4.1.Sai số đo
4.2.Độ chính xác của tập số liệu kết quả thực nghiệm
4.3.Độ sai biệt của tập số liệu kết quả thực nghiệm
4.4.Sai số tối đa cho phép ΔP(X)
4.5.Khoảng chính xác tin cậy
4.6.Khoảng giới hạn tin cậy của một tập số liệu kết quả đo
Chương 3 : Phân tích so sánh cặp tham số đặc trưng của hai tập số liệu kết quả đo
5.1.Giả thiết thống kê và kết luận thống kê
5.2.Quan hệ giữa chuẩn phân phối và kết luận thống kê
5.3.Phân tích so sánh
5.3.1.So sánh độ chính xác
5.3.2.So sánh sai biệt
PHẦN II: PHÂN TÍCH NHÂN TỐ ẢNH HƯỞNG LÊN SỐ ĐO
Chương 4 : Phân tích Hồi qui và Tương quan của các nhân tố
6.1.Hồi qui và Tương quan hai nhân tố
6.1.1.Hồi qui tuyến tính
6.1.2.Hồi qui phi tuyến tính
6.1.3.Hệ số tương quan (r) Spearman
6.1.4.Hệ số tương quan thứ bậc Spearman rho
Trang 36.2.Hồi qui và tương quan đa nhân tố
chương 5: Phân tích tác động của các nhân tố qua tham số
( phân tích bằng phương sai )
7.1.Bài toán 1 yếu tố, k mức đo,mỗi mức đo lặp lại n lần
7.2.Bài toán 2 yếu tố A và B; yếu tố A, k mức đo; yếu tố B, m mức đo; với mỗi mức của 2 yếu tố A và B đều tiến hành đo lặp lại n lần
7.3.Bài toán 3 yếu tố trở lên ( Phương pháp Ô vuông Latin)
Chương 6 : Phân tích tác động của các nhân tố không qua tham số
8.1.Bài toán tỷ lệ giữa 2 đại lượng, mỗi đại lượng 2 mức
8.1.1.Dùng chuẩn Khi bình phương ( χ2 ) để đánh giá
8.1.2.Dùng Hệ số tương quan để đánh giá
8.2.Bài toán tỷ lệ giữa 2 đại lượng X ( có s mức ) và Y ( có r mức )
8.3.Bài toán so sánh 2 tỷ lệ
PHẦN III- KÊ HOẠCH HOÁ THỰC NGHIỆM
Chương 7: Mô hình hoá thực nghiệm đa nhân tố bậc một đầy đủ và rút gọn
9.1 Đại cương về mô hình hoá thực nghiệm đa nhân tố
9.2.Mô hình hoá thực nghiệm bậc 1 đầy đủ :
9.3 Mô hình hoá thực nghiệm bậc 1 rút gọn:
Chương 8: Mô hình hoá thực nghiệm đa nhân tố bậc hai đầy đủ hay rút gọn
10.1- Mô hình hoá thực nghiệm bậc 2 tâm trực giao
10.2- Mô hình hoá thực nghiệm bậc 2 tâm xoay:
Chương 9 : Phương pháp mạng đơn hình
PHẦN IV- TỐI ƯU HOÁ THỰC NGHIỆM
10.1- Khái niệm và phân loại các phương pháp tối ưu hoá:
10.2.Phương pháp thực nghiệm theo đường dốc nhất
10.3 Phương pháp khảo sát mặt mục tiêu
10.4.Phương pháp thực nghiệm theo đơn hình
Phụ lục 1 : Các bài tập ôn luyện
Trang 4PHẦN I
XỬ LÝ SỐ LIỆU KẾT QUẢ ĐO
CHƯƠNG 1
CÁC ĐẶC TRƯNG THỐNG KÊ CỦA MỘT TẬP SỐ LIỆU KẾT QUẢ ĐO
Những đại lượng đặc trưng chính cho một tập số liệu kết quả đo, được phân làm 3 loại
chính :1/ Các tham số đặc trưng về sự tập trung của tập số liêu, 2/ Các tham số đặc trưng về
sự phân tán của tập số liệu, 3/ Đặc trưng phân phối thống kê của tập số liệu
1 Các tham số đặc trưng về sự tập trung của tập số liêu:
1.1 Tần suất (p i ):
Giả thiết có một tập số liệu kết quả đo gồm có N số liệu, trong đó có ni giá trị Xi (Xi
xuất hiện ni lần) ni gọi là tần số của giá trị Xi, khi đó, tần suất của giá trị Xi được tính như sau:
Trang 5Bảng biểu diễn số liệu thống kê 100 kết quả đo từ 100 đối tượng đã cho trên đây theo phân nhóm cách nhau khoảng 17 đơn vị một trình bầy như sau:
Nhóm Tần số Giá trị TB Tần suất Tần xuất dồn
Việc phân nhóm một tập số liệu được tiến hành qua một số bước:
Ví dụ 2: Trắc nghiệm môn toán được tiến hành đối với một lớp học Dới đây là điểm số của
Bước 2: Tính khoảng của nhóm : 36 : 10 = 3,6 , chẵn hoá là 4
Bước 3 : Tính khoảng của nhóm có giá trị nhỏ nhất: 12 + 3= 15 , ta có nhóm có giá trị nhỏ nhất là 12-15, tư dó xây dưng nên các nhóm có giá trị cao hơn, đếm các giá trị nằm trong tập
số liệu để tìm tần số của nhóm, kết quả ta có tập số liệu trên được phân nhóm như sau:
9 8 7 6 5 4 3 2
Trang 6Số trội (Mo) là số có tần suất lớn nhất (chính là số có tần số xuất hiện lớn nhất ) trong
tập số liệu kết quả đo
1.3 Khoảng của tập số (R):
Khoảng của tập số ,R , là khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất của tập
số liệu kết quả đo Như vậy, khoảng của tập số được tính theo công thức sau:
R = Xmax - Xmin 1.2
1.4 Số trung vị (Med) và số tứ phân vị (Q):
Số trung vị (Med) là số đứng giữa tập số liệu đã được xắp xếp theo thứ tự từ bé đến
lớn, chia dãy số đó làm 2 phần bằng nhau về số số liệu
a/ Đối với các số liệu không nhóm lại :
Giả sử X1, X2 ,X3 Xn là dãy các giá trị của tập số liệu kết quả đo, được sắp xếp theo thứ tự tăng dần, thì :
-Số trung vị của tập N số lẻ được tính theo công thức sau:
2
1 N
XMed= + 1.3
Ví dụ 3 : Tìm trung vị của tập số : 5 , 7 , 9 , 1 3 , 1 5 , 1 6 , 1 9
Giải: Med = X(7+1)/2 = X4 , số thư 4 là số 13 vậy Med =13
-Số trung vị của tập N số chẵn được tính theo công thức sau:
[ ]
2
1
1 2
= XN XNMed 1.4
8 2
Med = (X4 +X5)/2 , vậy Med = (9 +13)/2 = 11
b/ Đối với số liệu gộp thành nhóm :
- Tìm trung vị tập số liệu có phân nhóm theo công thức sau:
Meadian ( 2 )
N cf
fm = Tần số ứng với khoảng điểm kế tiếp với khoảng điểm có tần số dồn được chọn
i = Giá trị khoảng điểm (interval)
Trang 7Ví dụ 5: Tính giá trị trung vị cho tập số liệu sau:
5020232,5 ( ) 3 32,5 1,3 33,8
9
Meadian M
a/ Đối với các số liệu không nhóm lại :
-Số tứ phân vị của tập N giá trị chia hết cho 4, thì tính theo công thức:
]XX[2
1Q
1 4
N 4
1 4
N 3 4
N 3
N 3
Q
+
= 1.8
b/ Đối với số liệu gộp thành nhóm :
Giả sử nhóm thứ i ( Xi, Xi + 1 ) có ni giá trị nằm trong nhóm đó và ta có
nk
n2
Tương tự, các tứ phân vị được xác định theo công thức chung sau đây:
Trang 8k k 1 k
1 k 1
i i (X X ) Xnk
n4
N.S
1 ( 4 )
N cf
N cf
Gọi X là giá trị trung bình cộng của một tập số liệu không phân nhóm thì X được
tính theo công thức sau:
Ví dụ 7: Điểm thi môn toán của 10 học viên thuộc nhóm khá là : 78, 79, 62, 84, 90, 71, 76,
83, 98, 77 Điểm trung bình của 10 học viên là:
1
10
779883767190846279
Trang 9Trong trường hợp tập số liệu được phân nhóm, giá trị trung bình cộng được thính theo công thức tổng quát sau:
= ∑
+ + +
+ + +
f f
x f x
f x f
2 1
2 2 1
Trong đó : xi là giá trị trung bình của nhóm, fi tần số của nhóm
Ví dụ 8: Điểm thi trắc nghiệm của 100 học viên cho ở bảng sau:
Điển số Tần số Giá trị trung
bình nhóm
Tần số x giá trị trung bình nhóm
Công thức tính giá trị trung bình cho tập số liêu phân nhóm cũng dùng cho trường hợp tính giá trị trung bình gia quyền (có trọng số), khi đó fi trọng số của giá trị xi
Trong thực tế, người ta tính giá trị trung bình của một tập số liêu phân nhóm theo công thức sau:
i = Khoảng điểm (interval), N = Số lượng các trường hợp (Numbers)
Ví dụ 9: Tính số trung bình công của các điểm số được nhóm thành các khoảng điểm của tập số liêu sau
Trang 101.6 Trung bình nhân :
GMx = n x1x2x3 x n 1.17 Thường dùng để tính tốc độ tăng trung bình của tăng theo cấp số, sự pha loãng
Ví dụ 10: Thống kê số học viên tại chức đăng ký dự thi trong 4 năm của một cơ sở đào tạo cho ở bảng dưới đây Tính 1/ Bình quân số đăng ký dự thi trong 4 năm, 2/ Tốc độ đăng ký dự thi tăng bình quân trong 4 năm
1 1.18
Dùng để tính vận tốc, thời gian trung bình
Ví dụ 11: Trung bình 1 giờ, học viên A giải được 8 bài toán, học viên B giải được 7 bài toán, học viên C được 10 bài toán Tính tốc độ giải toán bình quân của 3 học viên trên
Giải:
HMx= 8,15
10
17
181
++
bài / 1 giờ
1.8 Trung bình của hệ : (trung bình gia quyền)
X h=
K B
A
k k B
B A A
N N
N
X N X
N X N
+ + +
+ + +
1.19 Dùng để tính trung bình của hệ gồm nhiều tập số liệu hoặc tập số liệu có trọng số
Ví dụ 12: Tính điểm bình quân của 5 lớp khối 10 thi môn Toán theo bảng dữ kiện sau:
Trang 112 Các tham số đặc trưng cho sự phân tán của tập số liệu :
2.1 Phương sai (σ2 hoặc S 2 ):
Phương sai là trung bình của tổng bình phương sai khác giữa các giá trị của tập số liệu
so với giá trị trung bình của tập số liệu kết quả đo:
2 i
'N
1
S 1.20
Với: N' = N khi N > 30 (σ2) N' = N - 1 khi N < 30 (S2)
N' có bản chất là bậc tự do của tập số liệu kết quả đo
công thức thực dụng để tìm phương sai:
2 N 1
i i2
i
N
)X( X({'N
)(
2 2
−+
−+
−+
+
B A
B B A
A B B A A
N N
X X N X X N S N S N
1.22
Trong đó : S*2A=
A
A A N
S
Phương sai đặc trưng cho sự sai biệt của các số liệu trong kết quả đo Phương sai càng
lớn, sai biệt càng lớn Ngược lại phương sai càng nhỏ thì sai biệt càng nhỏ
Phương sai còn biểu diễn độ phân tán của tập số liệu kết quả đo đối với giá trị trung
bình Phương sai càng lớn độ phân tán chung quanh giá trị trung bình càng lớn và ngược lại
2.2 Độ lệch chuẩn (σf hoặc S f ):
Độ lệch chuẩn của một tập số liệu kết quả đo là giá trị căn bậc 2 trị số phương sai của nó:
σf = σ2 hoặc Sf = S2 1.23
Độ lệch chuẩn có cùng thứ nguyên và cũng có ý nghĩa như phương sai
Trong thực tế, người ta hay tính độ lệch chuẩn theo công thức sau đây:
N
d N
x xi
=
2 2
) ( 1.24
Ví dụ 13: Xác định S của các điểm số không phân nhóm sau đây:
Trang 12Mean = 83 5,89
10
34810
)83
Ví dụ 14: Tính độ lệch chuẩn của tập số liệu được phân nhóm sau đây
2.3.Độ sai chuẩn ( σ hoặc X S ): X
Độ sai chuẩn bằng độ lệch chuẩn chia cho căn bậc 2 của số giá trị kết quả đo:
N
f X
Trang 132.4.Hệ số biến thiên (C v ):
Hệ số biến thiên là tỷ số giữa độ lệch chuẩn với giá trị trung bình:
100.X
S
CV = f 1.26
Vì hệ số biến thiên không có thứ nguyên, cho nên có thể dựa vào hệ số biến thiên để
so sánh gần đúng độ sai biệt của các kết quả đo thu nhận được bằng các cách khác nhau
Khi độ lệch chuẩn lớn (Sf) ( tức sai biệt của các số liệu đo lớn), thì Cv lớn và ngược lại
Ví dụ 16: Đánh giá sự phát triển của trẻ 7 tuổi theo cân nặng trung bình là 20,37 kg với độ lệch chuẩn là 2,16 kg; trong khi đó, nếu đánh giá theo chiều cao trung bình là 113,64 cm với
độ lệch chuẩn là 4,04 cm Hỏi đánh giá nào mắc sai số lớn hơn?
Vậy theo cân năng mắc sai số lớn hơn
Ví dụ 17: 10 người học có điểm trung bình môn Toán và môn ngoại ngữ tương ứng là 85 và
72, trong khi đó học có độ lệch chuẩn của môn Toán và ngoại ngữ đều là 6,82
Tính Cv cho môn toán là:
Vậy, tuy có đô lệch chuẩn giống nhau, nhưng sai số đối với môn ngoại ngữ lớn hơn
3 Các đặc trưng phân phối thống kê của tập số liệu:
Đặc trưng phân phối thống kê của một tập số liệu kết quả đo là qui luật phân bố ngẫu nhiên của các giá trị kết quả đo trên trục số thực Đặc trưng phân phối thống kê là qui luật,
nên về mặt toán học nó thường được biểu diễn bằng một hàm số và có đồ thị tương ứng
Mỗi tập số liệu kết quả nghiện cứu là một tập số ngẫu nhiên (thường là rời rạc) có những đặc trưng phân phối thống kê riêng và thường tuân theo 1 trong 6 qui luật phân phối thống kê ngẫu nhiên phổ biến nhất, đó là:
3.1 Phân phối chuẩn (phân phối Gauss)( u):
- Hàm số của phân phối chuẩn được biểu diễn bằng phương trình toán học:
2 2
) X (2
1)X(
πσ
Trang 14Trong đó:
X : là biến số ngẫu nhiên
μ : là hằng số, bằng giá trị kỳ vọng của biến ngẫu nhiên
σ : là hằng số, bằng giá trị phương sai của biến ngẫu nhiên
Gọi u là chuẩn Gauss và đặt:
πσ
Dạng chính tắc của hàm phân phối chuẩn là dạng của hàm phân phối chuẩn đã chuyển hệ toạ
độ từ Y(X) sang Y(u)
- Đồ thị của hàm phân phối chuẩn:
Nếu đặt σ là đơn vị của thang chia trục hoành mà giá trị của nó được xác định từ điểm uốn
của đường cong chuẩn hạ xuống trục hoành, μ là tham số đặc trưng cho sự tập trung các giá trị của hàm phân phối, thì hàm phân phối chuẩn có dạng chuông úp ( xem trang bên)
Hàm phân phối chuẩn có đặc diểm là: X ≅ Mo ≅ Med ≅ μ
- Dạng tích phân của hàm phân phối chuẩn:
)u(
P)u(Fdu)u(
Trang 15-ý nghĩa hình học của tích phân là diện tích giới hạn bởi đường cong :
bởi đường cong cũng chính là độ tin cậy thống kê để xuất hiện Xi trong khoảng tích phân Kí hiệu độ tin cậy thống kê để xuất hiện giá trị Xi nằm trong vùng (- ∞, Xi) là P(Xj)
Độ tin cậy thống kê luôn là một số nhỏ hơn hoặc bằng 1 ( P(Xj) ≤1 )
Nếu kí hiệu ∝ là Độ không tin cậy thống kê, thì:
P + α = 1 hay P = 1 - α hoặc α = 1 - P
Khi P =1, điều đó có nghĩa là xác suất xuất hiện giá trị Xi là 100%
Trong xác suất, người ta qui ước:
Biến cố có P = 0.9999 là biến cố hoàn toàn chắc chắn
Biến cố có P = 0.999 là biến cố hết sức chắc chắn
Biến cố có P = 0.99 là biến cố rất chắc chắn
Biến cố có P = 0.95 là biến cố chắc chắn
Biến cố có P = 0.90 là biến cố có chiều hướng chắc chắn
Từ hàm phân phối chuẩn, khi cho một giá trị ui (X) thì ta tính được độ tin cậy thống kê
Pi, ứng với một diện tích Pi Ngược lại, khi cho giá trị Pj thì có thể tính được một giá trị uj(X) Thay cho tính toán, người ta lập sẵn những bảng số để tra giá trị u khi biết giá trị P hoặc ngược lại (xem phụ lục A)
3.2 Phân phối student (phân phối t):
Hàm số của phân phối student có dạng:
2
1 f 2
)f
t1(B),(y
u N
S X f
f f
=
−
= khi N ∞ thì S σ và t u 1.32
Sf là độ lệch chuẩn, Sx là độ sai chuẩn
Hàm phân bố t phụ thuộc vào biến số t là một biến ngẫu nhiên
f : bậc tự do (f = N - 1) ; B : là một hằng số
Sf: độ lệch chuẩn Vậy t bao giờ cũng phụ thuộc vào bậc tự do
Trang 16- Đồ thị của hàm phân phối student:
Khi Xi là số có tần số rất lớn (tức là số có tần suất rất lớn) thì có thể suy ra gần đúng Xi ≅ X (giá trị có tần suất rất lớn thì giá trị của nó coi như trùng với giá trị trung bình)
Đồ thị của hàm Student giống như hàm phân phối chuẩn có dạng chuông úp Nó có đầy đủ các tính chất giống như hàm phân phối chuẩn Nhưng khác ở chỗ:độ nhọn của đồ thị hàm phân phối student phụ thuộc vào bậc tự do Y(p, f)
Bậc tự do càng lớn thì độ nhọn càng nhỏ và ngược lại Do độ nhọn phụ thuộc vào bậc
tự do, nên giá trị chuẩn t cũng phụ thuộc vào bậc tự do t(p,f).Trong thực tế, người ta nhận thấy :
N > 30: tuân theo phân phối chuẩn
N < 30: tuân theo phân phối Student
Đối với phân phối Student cũng có bảng tra chuẩn Student tính sẵn Dựa vào bảng này, khi biết hai trong ba giá trị t, f và P thi xác định được giá trị còn chưa biết
Có 2 loại bảng tra giá trị t (gọi là bảng phân vị của chuẩn t) Khi giả thiết thống kê đặt là :
* Nếu giả thiết : *Nếu giả thiết :
-H0 : Xi = Xk -H0 : Xi = Xk
-Ha : Xi > Xk hoặc Xi < Xk -Ha : Xi ≠ Xk
Thì tra bảng phân vị Thì tra bảng phân vị
của chuẩn t theo 1 phía của chuẩn t theo 2 phí
3.3 Phân phối Fisher
Hàm số của phân phối Fisher có dạng:
Y(F, f1, f2) = A
2 f f 1 2
) 2
2 (
2 1 1
)f(f
+
−
f F
1.28
Trong đó: F là biến số ngẫu nhiên; f1, f2 là các bậc tự do ; A là hằng số phụ thuộc f1 và f2
F phụ thuộc vào hai loại bậc tự do và được tính theo công thức sau
Trang 171
f 2 f 2
2 2
2 1S
SF
Tuỳ thuộc vào bậc tự do mà đồ thị có các dạng khác nhau Hàm phân phối Fisher cũng
có tính chất như các hàm phân phối khác Diện tích giới hạn bởi đường cong cũng biểu diễn
độ tin cậy thống kê
Người ta cũng lập các bảng tra sẵn, khi cho (P, f1 và f2) sẽ tra được giá trị của chuẩn
F, ngược lại cho 3 trong 4 thông số ( F,P,f1,f2 ) sẽ tra được số thứ 4 chưa biết
Có 2 loại bảng số chính để tra chuẩn F: Bảng F(0.95,f1, f2) và bảng F(0.99,f1,f2) (xem phụ lục A)
3.4 Phân phối Khi bình phương:
Hàm số của phân phối Khi bình phương có dạng:
2
2 f 2 2
(Y
2 f
i
2 (X X) Khi lấy các giá trị : 0 < χ < + ∞ 1.35 Hàm Khi bình phương chỉ phụ thuộc vào 1 bậc tự do
Đồ thị của hàm phân phối Khi bình phương có dạng:
Nếu cho trước độ tin cậy thống kê P và giá trị f, tra bảng sẽ tìm được giá trị χ2 và ngược lại
x
0 5
15 10
5 0
f(x)
7 5
3 1
Trang 183.5 Phân phối Poisson:
-Hàm số của phân phối Poisson có dạng:
!X
e.)X(
n = số lần biến cố A xuất hiện
Khi đó: nếu X là biến ngẫu nhiên có đặc trưng phân phối thống kê với tham số ( N,p )
là phân phối nhị thì:
- Kì vọng của biến ngẫu nhiên X là: Np
- Phương sai của biến ngẫu nhiên X là : σ2 = Npq
- Độ lệch chuẩn của biến ngẫu nhiên X là : σ= Npq 1.38
- Độ sai chuẩn của biến ngẫu nhiên X là: σx = pq
-Đồ thị của hàm phân phối nhị thức có dạng :
Cần phân biệt khái niệm hàm phân phối và chuẩn phân phối (chuẩn thống kê):
- Hàm phân phối là qui luật phân bố số liệu kết quả đo có tính ngẫu nhiên (các biến ngẫu nhiên)
- Chuẩn phân phối (chuẩn thống kê) là những giá trị của hàm phân phối tính được theo điều kiện cho trước
Trang 19Như vậy chuẩn phân phối có 2 dạng: Giá trị tra bảng và Giá trị tính được
Người ta so sánh giữa giá trị tra bảng và giá trị tính được để đánh giá độ tin cậy thống
kê của một sự kiện, theo điều kiện cho trước (theo giá trị tra bảng)
3.7 Mối quan hệ giữa các hàm phân phối và các chuẩn phân phối:
Ta có nhận xét, một tập số liệu kết quả thực nghiệm phụ thuộc vào bậc tự do:
+ 2 bậc tự do thì tuân theo hàm F
+ 1 bậc tự do thì tuân theo hàm t hoặc χ 2 + Không phụ thuộc vào tự do thì tuân theo hàm u hoặc P
Trong thực nghiệm, cách xác định định tính luật phân phối của 1 tập số liệu kết quả
đo như sau:
-Nếu N >30 và có 1 trong 3 tính chất sau thì tập số liệu kết quả đo có qui luật phân
phối chuẩn:
1/ Đồ thị phân phối tần suất có dạng chuông
2/ Mo ≅ Med ≅ X
3/ Xi nhận các giá trị ở ngoài khoảng X ± 2 σ là 5% hoặc
Xi nhận các giá trị nằm ngoài khoảng X ± 3 σ là 1%
-Nếu N < 30 và có 1 trong 3 tính chất trên thì tập số liệu kết quả đo có qui luật phân
phối Student
Sơ đồ sau đây cho thấy các qui luật phân phối thống kê đã trình bày chỉ là 1 trường
hợp riêng của nhau mà thôi:
Phân phối F 2
2
2 1
X
t f = −μ
2
S
f 2N
2 =
χ Y(χ2 ,f) f= ∞ f = 1
Y(t,f) →Y(u) Y( χ2 ,f) →Y(u)
! X
Trang 20CHƯƠNG 2
ĐÁNH GIÁ TẬP SỐ LIỆU KẾT QUẢ ĐO
Một tập số liệu kết quả đo có thể được phân tích đánh giá thông qua các đại lượng chính sau đây:
4.1 Sai số đo:
Có 4 loại sai số đo:
- Sai số tuyệt đối:
εA = Xi - X ≡ Xi - μ 2.1
Sai số tuyệt đối là sự sai khác của một giá trị đo nào đó với giá trị trung bình
( hoặc giá trị thật ) Sai khác này có thể là âm hoặc dương
- Sai số tương đối:
.100
X
X100.X
Sai số tương đối là tỷ số của sai số tuyệt đối đối với giá trị trung bình Sai số này
không có thứ nguyên cho nên được dùng để so sánh sai số tương đối của các phương pháp đo cho kết quả không cùng thứ nguyên
- Sai số hệ thống:
ΔX = X - μ ≠ 0 2.3
Nếu hiệu số này là đáng tin cậy tức là khác không là đáng tin cậy thì số đo đã mắc sai
số hệ thống Khi đó giá trị Xi tập trung về một phía của giá trị thực trên trục số Sai số hệ thống có thể tìm được nguyên nhân gây sai số hệ thống để loại bỏ
- Sai số ngẫu nhiên:
ΔX = X - μ ≈ 0 2.4
đo mắc sai số ngẫu nhiên khi hiệu số giữa giá trị trung bình cộng X với giá trị thật
gần bằng không là đáng tin cậy Khi đó các giá trị Xi phân bố đều hai phía của giá trị thực trên trục số Sai số ngẫu nhiên bao giờ cũng mắc phải và chỉ có thể tìm các giải pháp để giảm sai
số ngẫu nhiên
4.2 Độ chính xác của tập số liệu kết quả đo
Vì trung bình cộng biểu diễn độ tập trung của các giá trị thực nghiệm nên độ chính xác của tập số liệu kết quả đo được đánh giá thông qua giá trị trung bình cộng Giá trị trung bình cộng mà sai khác với giá trị thật càng nhỏ thì độ chính xác của số đo càng lớn và ngược lại
Nguyên nhân dẫn đến độ chính xác kém có thể là:
- Chọn mẫu không đúng về chất lượng và số lượng
- Giải pháp đo số liệu không chính xác
4.3.Độ sai biệt của tập số liệu kết quả đo:
Vì phương sai biểu diễn độ sai biệt trung bình của các giá trị trong tập số liệu kết quả
đo so với giá trị trung bình Phương sai càng nhỏ thì độ sai biệt càng nhỏ và ngược lại
Nguyên nhân chính dẫn đến độ sai biệt lớn:
- Chọn mẫu về chất lượng và số lượng không đặc trưng cho mục tiêu đo
- Tay nghề người làm đo kém, không thu thập được số đo
Trang 21Thực ra giá trị trung bình cộng X cũng phản ánh phần nào độ sai biệt khi so với giá
trị thật và ngược lại giá trị phương sai S2 cũng phản ánh phần nào độ chính xác khi độ sai biệt
nhỏ Tuy nhiên mỗi đại lượng có tính trội biểu diễn cho độ chính xác và độ sai biệt khác nhau:
X có tính trội phản ánh độ chính xác, S2 có tính trội phản ánh độ sai biệt
Hình vẽ minh hoạ độ chính xác và độ sai biệt
Độ sai biệt (Precision) : Cực kỳ nhỏ lớn nhỏ
Độ chính xác (Accuracy): Cực kỳ tốt Tốt Tồi
Kết luận : Đúng - Tốt Sai số ngẫu nhiên Sai số hệ thống
4.4 Sai số tối đa cho phép ΔP(X)
Sai số tối đa cho phép ΔP(X) của một tập số liệu kết quả đo được qui định: cho phép
lấy các giá trị Xi sai khác với giá trị trung bình X lớn nhất là ±3σ Nó phản ánh tính thống
kê của kết quả đo Sai số tối đa cho phép chia làm hai loại:
+ Sai số tối đa cho phép tuyệt đối:
)X(
P = ± σ
Δ
2.6
Sai số tối đa cho phép tương đối được biểu diễn dưới dạng phần trăm (%) do đó không
còn thứ nguyên, dùng để so sánh sai số tối đa cho phép tương đối của phương pháp đo này với
sai số tối đa cho phép tương đối của phương pháp đo khác
Những giá trị kết quả đo nào nằm ngoài khoảng sai số tối đa cho phép tuyệt đối thì
phải loại bỏ (và gọi các giá trị đó đã mắc sai số thô )
4.5 Khoảng chính xác tin cậy:
Khoảng chính xác tin cậy được tính theo công thức sau:
ΔX(P,f) = X - μ = t(P,f).Sx 2.7
Trong đó:
P: độ tin cậy thống kê
f: bậc tự do của tập số liệu kết quả đo
x
S : Độ sai chuẩn
Khoảng chính xác tin cậy của một tập số liệu kết quả đo chính là khoảng sai khác giữa
giá trị trung bình với giá trị có một độ tin cậy thống kê cho trước Như vậy khoảng chính xác
tin cậy của 1 tập số liệu kết quả đo phụ thuộc vào độ tin cậy thống kê (P) và bậc tự do (f)
Khoảng chính xác tin cậy của mỗi giá trị kết quả đo được tính như sau:
ΔXi(P,f) = Xi - X = t(P,f).Sf 2.8
t(P,f): là giá trị tra ở bảng phân vị của hàm phân phối Student
Trang 22Khi một tập số liệu kết quả đo có khoảng chính xác tin cậy không thoả mãn với độ tin cậy thống kê (P) cho trước thì có thể tăng thêm số mẫu (N) đo Số mẫu đo cần thiết để có khoảng chính xác tin cậy trùng với khoảng chính xác tin cậy lý thuyết cho trước, được tính theo công thức sau:
2 f
X
Sf,P(tN
= Trong đó: ΔX là cho trước 2.9
4.6 Khoảng giới hạn tin cậy của một tập số liệu kết quả đo:
Khoảng giới hạn tin cậy của một tập số liệu kết quả đo được qui định nằm trong khoảng:
X ± ΔX(p,f) = X ± t(p,f) Sx 2.10
Giá trị Xi bất kỳ của một tập số liệu kết quả đo được chấp nhận theo độ tin cậy thống
kê P cho trước, có bậc tự do f = N-1 phải luôn nằm trong khoảng giới hạn tin cậy và thường được biểu diễn như sau:
a/ Tinh các đại lượng đặc trưng của tập sô liệu trên
b/ Phân tích đánh giá tập số liệu
Trang 23CHƯƠNG 3
SO SÁNH CẶP THAM SỐ ĐẶC TRƯNG CỦA HAI TẬP SỐ LIỆU KẾT QUẢ ĐO
5.1 Giả thiết thống kê và kết luận thống kê:
5.1.1.Giả thiết thống kê:
Giả sử ta có Xi và Xk là 2 tham số đặc trưng của 2 tập số liệu kết quả đo Xuất hiện 2 giả thiết thống kê, trình bầy ở bảng sau:
Giả thiết thống kê Ký hiệu í nghĩa Biểu diễn
Giả thiết không
(giả thiết không liên quan) H0 Xi ≡ Xk Xi - Xk ≡ 0
Giả thiết khác không
(giả thiết liên quan) Ha (H1) Xi ≠ Xk
Bác bỏ H 0 ; Chấp nhận H a
Kết luận thống kê loại 2:
Chấp nhận H 0 ; Bác bỏ H a H0
(Xi ≡ Xk) Ha (Xi ≠ Xk) Sai (Sai lầm loại 1)
Đúng
Ha
(Xi ≠ Xk) H0 (Xi ≡ Xk) Đúng Sai ( Sai lầm loại 2)
+ Kết luận thống kê loại 1: Phủ định H0 (bác bỏ H0) và Khẳng định Ha (chấp nhận Ha) Kết luận thống kê loại 1 dẫn đến sai lầm loại 1, đó là Đúng là H0 (xi ≡xk) lại kết luận là Ha (xi
≠ xk) Nói một cách khác: đúng là chúng giống nhau lại bảo chúng khác nhau.”
+ Kết luận thống kê loại 2: Phủ định Ha (bác bỏ Ha).Khẳng định H0 (chấp nhận H0)
Kết luận thống kê loại 2 dẫn đến sai lầm loại 2, đó là đúng là Ha (Xi ≠ Xk) lại kết luận là H0 (Xi ≡ Xk) Nói một cách khác : đúng là chúng khác nhau lại kết luận chúng giống nhau
Cần nhớ rằng : Kết luận thống kê là khẳng định ( hay chấp nhận ) một giả thiết thống
kê này và phủ nhận ( hay bác bỏ ) giả thiết thống kê kia, chứ không có nghĩa là cho rằng giả thiết thống kê này đúng còn giả thiết thống kê kia sai
Trong trường hợp buộc phải kết luận thống kê thì phải giữ nguyên tắc: thà mắc sai
lầm loại 1 còn hơn mắc sai lầm loại 2 Nói cách khác: nếu không đủ bằng chứng để khẳng định giả thiết H0, thì thà phủ nhận giả thiết H0, còn hơn khẳng định giả thiết H0.
Trang 245.2 Quan hệ giữa chuẩn phân phối và kết luận thống kê
Các chuẩn phân phối có thể tính được từ các số liệu của tập số liệu kết quả đo:
XX
xS
S
S
f i N 1 i ) , P (
S
XX
=
=
Sơ đồ quan hệ giữa chuẩn phân phối và kết luận thống kê:
- Nếu t tính < t bảng nghĩa là độ tin cậy thống kê của ttính nhỏ hơn độ tin cậy thống kê của tbảng vậy thì ttính không đáng tin cậy bằng tbảng
Do ttính không đáng tin cậy bằng tbảng nên hiệu số X - μ không đáng tin cậy, điều đó
có nghĩa sự khác nhau giữa giá trị trung bình và giá trị thật là không đáng tin cậy Vì chúng khác nhau không đáng tin cậy cho nên có thể coi như chúng giống nhau (chấp nhận H0, phủ nhận Ha)
- Nếu t tính > t bảng , thì ttính có độ tin cậy thống kê lớn hơn độ tin cậy thống kê của tbảng
Vì vậy ttính đáng tin cậy và do đó hiệu số X - μ chỉ sự sai khác giữa X và μ là đáng tin cậy (phủ nhận H0, chấp nhận Ha)
- Nếu t tính = t bảng thì độ tin cậy bằng nhau cho nên X - μ thoả mãn độ tin cậy thống kê cho trước Nói cách khác độ chính xác tin cậy của tập số liệu kết quả đo thoả mãn độ tin cậy
t t = t b f(x)
t b < t t
Trang 25thống kê cho trước Trong trường hợp này, chúng ta chọn thà mắc sai lầm loại 1 còn hơn mắc sai lầm loại 2 để kết luận thống kê Nghĩa là thà kết luận X khác μ hơn là kết luận X giống
μ để chọn quyết định cho phù hợp
Do tbảng phụ thuộc độ tin cậy thống kê ( P ) cho trước, nên một kết luận thống kê rút ra được chỉ ứng với một độ tin cậy thống kê cho trước mà thôi Khi độ tin cậy thống kê thay đổi thì kết luận thống kê cũng có thể thay đổi theo
Lập luận về quan hệ giữa chuẩn phân phối t và kết luận thống kê cũng áp dụng cho các chuẩn phân phối khác Và việc sử dụng các chuẩn phân phối của các hàm phân phối để kết luận thống kê cho đúng - gọi là kiểm định thống kê (xem các ví dụ cuối chương)
Ví dụ 19: Sử dụng 4 kết quả đo A,B,C và D Kết quả làm lặp lại theo mỗi đo 6 lần thu được trình bày trong bảng sau :
a/ Tính giá trị Trung bình và Phương sai của mỗi đo và nhận xét
b/ Biết giá trị thật là 18,1 Phân tích đánh giá sai số của mỗi đo
1,1805,18
1,1875,17
= = 6,48 >> tb ( 95,5 ) = 2,57
Kết luận : Ha : x ≠ μ → sai số hệ thống
Trang 26Trong thực tế, người ta còn sử dụng giá tri độ tin cậy P-value để kết luận thống kê:
P-value một phía = 0,5000 (giá trị của z tại μ = 0) - giá trị tra bảng của z
P-value hai phía = 2(0,5000 - giá trị tra bảng của z)
Với : P-value ≤ α thì bác bỏ giả thiết H0 , chấp nhận Ha
P-value > α thì chấp nhận giả thiết H0 , bác bỏ Ha
Ví dụ 20: Điểm thi bài trắc nghiệm trung bình của khối 10 là 24, lấy ngẫu nhiên 36 thí sinh tính được giá trị trung bình là 24,7 với độ lêch chuẩn là 2 Đánh giá xem giá trị trung bình của các thí sinh này có khác của khối không?
Giải: - giả thiết H0 là μ ≤ 24 , Ha là μ > 24
- Tính giá trị 2,10
36/2
247,24
- Tra bảng z= 2,10 , tra được z (α =0.05)= ( 0,98214 - 0,5000 ) = 0.4821
- Tính hiệu: 0,5000 – 0,4821 = 0,0179, trong trường hợp 1 phía này đó chính là P-value
Vậy P-value = 0,0179 < 0,05 ( α ) , kết luận : bác bỏ H0 , nghĩa là 36 thí sinh này thực sự có điểm trung bình cao hơn khối 10
Ví dụ 21: Một nghiên cứu trẻ khuyết tật có chỉ số IQ trung bình là 80, kiểm tra lại với mẫu là
32 trẻ khuyết tật, cho thấy chúng có chỉ số IQ trung bình là 82, với độ lệch chuẩn là 6 Tại α=0.05 với mẫu kiểm tra như vậy có đủ độ tin cậy (P- value) để cho rằng nghiên cứu trên khác với mẫu kiểm tra không?
Giải: : - Giả thiết H0 là μ = 80 , Ha là μ ≠ 80
- Tính giá trị 1,89
32/6
8082
- Tra bảng z= 1,89 , tra được z (α =0.05)= ( 0,9706 – 0,5000) = 0.4706
- Tính hiêu: 0,5000 – 0,4706 = 0,0294 , trong trường hợp hai phía này, P-value cần nhân với 2
Vậy P-value = 2(0,0294) =0,0588 > 0,05 , kết luận: chấp nhận H0 , nghĩa là két quả nghiên cứu không khác với mẫu kiểm tra
5.3 So sánh cặp tham số đặc trựng của hai tập số liệu kết quả đo:
Có hai cặp tham số đặc trưng quan trọng nhất thường phân tích so sánh đó là:
* So sánh độ chính xác: Đặc trưng bởi X , khi đó có hai trường hợp chính:
1 So sánh X với μ
2 So sánh XA và XB
* So sánh độ sai biệt: đặc trưng bởi S2
Tuỳ theo NA và NB nhỏ hay lớn, giống nhau hay khác nhau, tiến hành so sánh theo cách khác nhau
Trang 27B AS
XX
=
Với N > 30 dùng chuẩn u , còn N < 30 dùng chuẩn t
Cánh tính toán chuẩn u hoặc t và so sánh với các giá trị tra bảng được phân thành các trường hợp sau:
5.3.1.1 Nếu NA và NB > 30 Dùng chuẩn u để so sánh:
utính = d N
N
dd
f f
A d
f
N N
B A
N.N
NN
5.3.1.2 Nếu NA và NB < 30, dùng chuẩn t để so sánh chia làm hai trường hợp chính:
1/ Nếu NA ≠ NB <30 (giống trường hợp 3.1.1)
N
Sf
dSx
d)f,p(
)1N()1N(
)1N(S)1N(SSd
B A
B
2 B A
2 A
−+
−
−+
−
B A
B A
N.N
NN
d),p(t
f x
2 B
2
Trang 28
'N
2N
2N
2N
B A
SN'
duS
d),p(t
f x
dud
N 1
)dd(Sd
N 1 u
2 i
2N
2N
2N
B A
Phân tích đánh giá và phân tích so sánh 2 kết quả đo trên
Giải:
x = 32,72 A x = 31,89 B
S2B = 1,327 S2B = 0,619
*Không liên quan từng đôi một:
H0 = 2 kết quả đo không khác nhau
2 B
2
=
Trang 291,9
10
2973,0
83,02
=
=
=
N S
d t
d t
tb ( 0,95 ; 18 ) = 2,101 Kết luận tt < tb → chấp nhận H0
*Liên quan từng đôi một :
H0 = 2 kết quả đo không khác nhau
Ha = 2 kết quả khác nhau
0,83
10
3,8n
d
11010
3,889,121
nn
)d(dS
2 2
2 2
10
667.0
83,0NS
dtd
t = = =
tb ( 0,95 ; 9 ) = 2,26 → ttính > tb ⇒ chấp nhận Ha
tb ( 0,99 ; 9 ) = 3,25 → ttính < tb ⇒ bác bỏ Ha
Nhân xét : - Khảo sát liên quan từng đôi một cho thấy có sự sai khác, trong khi khảo sát
không liên quan từng đôi một thì không thấy sự khác nhau
- Khi thay đổi độ tin cậy thông kê thì có thể dẫn đến thay đổi kết luận thống kê
5.3.2 So sánh độ sai biệt:
Vì Phương sai đặc trưng cho độ sai biệt, nên so sánh độ sai biệt , chính là so sánh
phương sai Người ta sử dụng chuẩn Fisher để so sánh:
2
2 1 2 1
S
S)f,f,p(
F = (S12 >S22) 3.21 Khi đó:
Giả thiết H0: S12 = S22 được chấp nhận khi và chỉ khi F không đáng tin cậy
2
2 > 1 nên : S12 > S22
Việc so sánh Ftính và Fbảng luôn phụ thuộc vào độ tin cậy thống kê cho trước
Ví dụ 23 : Cho hai tập số đo A và B thu được từ kết quả nghiên cứu như sau :
Trang 30B 4,29 4,52 4,57 4,56 4,66 - - -
17 18 19 20
A 4,80 4,36 4,75 4,22
B - - - -
a/ Tính các đại lượng đặc trưng của tập hai kết quả đo trên
b/ So sánh giá trị trung bình và giá trị phương sai của 2 đo A và B
0259,0S
S
2 B
6.1.Hồi qui và tương quan hai nhân tố :
Phân tích hồi qui và tương quan là tìm mối quan hệ giữa hai nhân tố X và Y xem chúng tuân theo qui luật nào (có thể được mô tả bằng mô hình toán học nào ) Các qui luật đó đều được biểu diễn bằng một hàm số Trong các tương quan, có tương quan tuyến tính được
sử dụng trong đo nhiều nhất
6.1.1 Hồi qui tuyến tính
Hồi qui tuyến tính giữa X và Y được biểu diễn bằng hàm số có dạng:
Y = aX + b 4.1
Để tìm hệ số a và b ta phải giải hệ phương trình :
∑Y = Nb + a∑X 4.2 ∑XY = b∑X + a∑X2
Giả hệ phương trình trên, hệ số a được tính theo công thức sau:
N
Y X Y
X X
X
Y Y X X a
i i
i i i
i N
i i
i N
i i
2 2
1
2
1
)(
)(
))(
(
4.3
Trang 31Còn hệ số b được tính sau khi biết a theo phương trình :
b = Y - aX 4.4
6.1.2 Hồi qui phi tuyến tính :
Hồi qui phi tuyến giữa 2 nhân tố X và Y là một đường cong, có thể
mô tả bằng đường hồi qui Parabon, Hypebon hay Hàm số mũ
1/Hồi qui Parabon có dạng:
Y = aX2 + bX + c 4.5
Để tìm các hệ số a,b, và c, phải giải hệ phương trình :
∑Y = a∑ X2 + b∑X + Nc 4.6 ∑XY = a∑X3 + b∑ X2 + c∑X
Căn cứ vào các dữ kiện đo, lập bảng theo các cột : Y, X, (X-X ), (X- X )2, (X-X )3, (X-X )4 để tính cho nhanh và khỏi nhầm lẫnđể giải hệ phương trình trên
2/Hồi qui Hypebon có dạng :
Y = a/X + b 4.8
Để tìm các hệ số a và b, ta phải giải hệ phương trình :
∑Y = a∑1/X + Nb 4.9
∑Y/X = a∑1/X2 + b∑1/X
6.1.3.Hệ số tương quan (r) Spearman
Hệ số r, đánh giá mức độ tương quan giữa X và Y:
2
)(
)(
Y Y
X X a
a
r
i
i y
Dấu của hệ số tương quan:
r > 0 giữa X và Y có tương quan thuận
r < 0 gữa X và Y có tương quan nghịch
ý nghĩa của hệ số tương quan:
Trang 326.1.4 Hệ số tương quan thứ bậc Spearman rho:
Hệ số ρ, đánh giá mức độ tương quan thứ bậc có thông số hoặc không thông số giữa 2 nhân tố X và Y với N số liệu đo tính theo công thức sau:
)1(
)(6
di Hro 4.11 Trong đó:
- d là sự sai khác giữa Xi và Yi Để tính giá trị d, Xi phải được xếp theo thứ tự từ thấp đến cao hoặc ngược lại, còn Yi được xếp tương ứng từng cặp
- N số số liệu đo ( số giá trị Xi hay Yj )
Ví dụ 24: Khảo sát kết quả thi trắc nghiệm môn Toán (T) và môn Hoá (H) cuối học kì của 10 học sinh, cho ở bảng sau :
a-Tìm phương trình hồi qui tương quan tuyến tính,
b- Hệ số tương quan Spearman,
c- Hệ số tương quan Spearman rho
Vây phương trình hồi qui tuyến tính có dạng : y = 0.556 x + 13,97
b- Hệ số tương quan spearman :
697 1
1254 1 683 1 0 753
Trang 33c-Hệ số tương quan Spearman hro:
6.2 Tính tương quan của sự kiện nhị phân:
Ví dụ 25: Lấy ngẫu nhiên 15 điểm môn Toan trong bảng điểm của một lơp học, kết quả cho ở bảng sau đây, trong đó có điểm của 9 Trai và 6 Gái :
độ lệch chuẩn của điểm số con trai tính ra là : σt =12.19, tỷ lệ con trai là p =9/15=0.6,
Tỷ lệ con gái là q= p-1 = 0,4 Tính điểm trung bình của Trai và Gái :
d = − = tra bảng tương quan nhi phân ta được: r( )13 0.05=0.514 vậy : r pb <r( )13 0.05,
Ta có thể kết luận là khả năng toán học của Tra và Gaí giống nhau
6.3.Hồi qui và tương quan đa nhân tố :
Phương trình hồi qui đa nhân tố ( n nhân tố ) có dạng tổng quát như sau :
Y=a0 +a i∑n X i +a ij∑n X X i j +a ij n∑n X X i j X n +a ij∑n X i +a ij ∑n X i n
2
1 1
1 1
1
Hồi qui và tương quan đa nhân tố cũng được phân thành hai loại tuyến tính và phi tuyến tính Việc giải các bài toán hồi qui và tương quan đa nhân tố cũng theo nguyên tắc có bao nhiêu hệ số phải có bấy nhiêu phương trình tham số để giải
Để có được các tham số để giải, người ta phải lập các ma trận thử nghiệm riêng ( ma trận tâm trực giao, ma trận tâm xoay ) và tiến hành thử nghiệm để có tập dữ liệu tương ứng cho việc giải
Trang 34CHƯƠNG 5:
PHÂN TÍCH TÁC ĐỘNG CỦA CÁC NHÂN TỐ QUA THAM SỐ LÊN SỐ ĐO
( PHÂN TÍCH PHƯƠNG SAI )
Phương pháp phân tích phương sai (ANOVA) có hai loại bài toán phổ biến và coi như
là cơ sở cho các bài toán chung về phân tích phương sai
- Bài toán một nhân tố, k mức đo, mỗi mức đo làm lặp lại n lần và
- Bài toán hai nhân tố A và B, nhân tố A làm k mức đo, nhân tố B làm m mức đo, với
mỗi mức của 2 nhân tố A và B cũng tiến hành đo lặp lại n lần
- Bài toán ba nhân tố trở lên
7.1 Bài toán một nhân tố :
Bài toán này được mô tả bằng một bảng qui hoạch đo có dạng sau:
N A A1 A2 A3 Ai Ak
1 y11 Y21 Y31 yi1 yk1
2 y12 Y22 Y32 yi2 yk2
3 y13 Y23 Y33 yi3 yk3
J
n ∑ y2j
J
N ∑ y3j
So sánh sự sai khác giữa các giá trị kết quả đo (yij) do thay đổi các mức đo ( Ai ) của
nhân tố A, phương sai của sự thay đổi các mức đo ) với sai số đo (Phương sai của sai số đo)
có khác nhau đáng tin cậy hay không
Nếu khác nhau không đáng tin cậy, nhân tố A tỏ ra không ảnh hưởng lên kết quả đo,
và ngược lại, nếu khác nhau đáng tin cậy thì chứng tỏ nhân tố A đã ảnh hưởng lên kết quả đo
Sử dụng chuẩn Fisher để so sánh phương sai:
S12: Đặc trưng cho sự khác nhau của kết quả đo (yij) do sự khác nhau giữa các mức
(Ai) của A gây ra
S22: Đặc trưng cho sai số đo nói chung, vì làm nghiên cứu bao giờ cũng mắc sai số
f1: Bậc tự do của tổng số các mức đo đã làm f1 = k - 1
f2: Bậc tự do của tổng số các đo đã tiến hành qui hoạch đo f2 = k(n - 1)
Với: Ho: S12 S
2 2
≡ ; Ha: S12 S
2 2
≠ ;
Vì F luôn lớn hơn 1 ( F > 1 ), nên:
- Nếu Ftính < Fbảng thì Ftính không đáng tin cậy, tức là S12╪ S22 không đáng tin cậy cho nên chúng được coi là giống nhau Chúng không khác nhau cho nên nhân tố A khi
thay đổi mức đã tỏ ra không có ảnh hưởng đến kết quả đo
Trang 35- Nếu Ftính > Fbảng thì Ftính đáng tin cậy, tức là S12 ╪ S22suy ra nhân tố A đã ảnh hưởng lên kết quả đo
Nhằm dễ tính toán, tránh nhầm lẫn, người ta lập bảng các công đoạn tính phương sai
để so sánh cho bài toán 1 nhân tố, k mức đo và n lần lặp lại như trên
Bảng trên thực chất đã sử dụng công thức tính phương sai:
S
X N
1
=
=
∑( ) 5.4
rồi tính Ftinh:
Ftính = S
S
A TN
2
2 so với Fbảng(P, fA, fTN) 5.6 trong đó fA = k -1; fTN = k(n-1)
7.2 Bài toán hai nhân tố :
Bài toán phân tích phương sai hai nhân tố:
Nhân tố A: k mức đo Nhân tố B: m mức đo Mỗi mức thử nghiệm lặp lại n lần Bảng qui hoạch đo của bài toán như sau:
A a1 a2 Ai Ak B1 y111,y112
, y11n
y211,y212 , y21n
yi11,yi12
.,yi1n
yk11,yk12 ,yk1n
yij1,yij2
., yijn
ykj1,ykj2 ,ykjn
Bm y1m1,
,y1mn
y2m1, .,y2mn
yim1, .,yimn
ykm1, .,ykmn
Trang 36Phương pháp tính phương sai của qui hoạch đo 2 nhân tố cho ở bảng sau: Yếu tố F ∑(Xi - X )2 S2
- SA2: Đặc trưng cho ảnh hưởng của nhân tố A lên kết quả đo
- SB2: Đặc trưng cho ảnh hưởng của nhân tố B lên kết quả đo
- SAB2: Đặc trưng cho ảnh hưởng đồng thời của cả hai yếu tố A và B lên kết quả đo
- STN2: Đặc trưng cho sai số đo
Các bước tính phương sai theo bảng trên như sau:
Với: u: đo lặp lại thứ u i: mức đối với A j: mức đối với B
Công thức trên chính là tổng tất cả các kết quả đo trong một ô (1 ô là tương ứng mô
tả điều kiện đo xij theo mức A (ai) và mức B (bj) trong đó làm lặp lại n lần )
Y ij y u ij
u
n
2 1
2
=
=
∑( ) 5.8
Tổng tất cả các kết quả đo Tổng tất cả các kết quả đo
trong 1 hàng: trong 1 cột:
A i y u
u
n ij i
u
n ij j
1 1
Trang 37Ví dụ 26 : Qui hoạch hai yếu tố : A, k mức; B, m mức; mỗi cặp mức làm lặp lại
14,0 13,2
9,5 8,6
B b3 7,3
8,5
38,2 37,7
5,1 5,9
54,4 55,2
20,8
60,1 60,9
19,6 18,5
58,2 59,7
Giải:
1- Tổng các giá trị trong 1 Ô vuông Latin :
a1 a2 a3 a4 Σ hàng b1 27,1 10,5 101,7 26,8 166,1 b2 39,1 37,7 27,2 18,1 122,1 b3 15,8 75,9 11,0 109,6 212,3 b4 40,8 121,0 38,1 117,9 317,8
Σ cột 122,8 245,1 178,0 272,4 818,3 2.Bình phương tổng các giá trị thực nghiệm trong 1 Ô:
b1 734,41 110,25 10342,89 718,24 b2 1528,81 1421,29 739,84 327,61
Trang 3825,26451
13,54)
75,881
S
S F
Nhân tố f ∑( ) 2 S2
A
B
AB Sai số Tổng
568,16 881,75 843,01 3,38
Trang 39249,41 (0,95;9,16) 2,65
38,3
01,843
SS
AB AB
Kết luận : yếu tố A, B và tương tức đồng thời AB đều ảnh hưởng mạnh lên kết quả đo
7.3 Bài toán ba nhân tố trở lên : Phương pháp Ô vuông Latin:
Trong trường hợp có ba nhân tố trở lên, người ta sử dụng phương pháp ô vuông la tinh
để xây dựng ma trận thử nghiệm.( Bảng qui hoạch thử nghiệm )
Bản chất của phương pháp ô vuông Latin là phương pháp phân tích phương sai nhưng
đã xây dựng bảng qui hoạch đo theo một qui luật riêng
Giả thiết có ba nhân tố A, B, C mỗi nhân tố có 4 mức nghiên cứu, Mỗi ô mô tả 1 điều kiện đo là tổ hợp các mức đo của 3 nhân tố Thí dụ: ô 1 khi làm đo A lấy mức a1, B lấy mức b1 C lấy mức c1
Nguyên tắc xây dựng qui hoạch đo theo ô vuông Latinh như sau: không được để cho
một điều kiện đo xác định lặp lại trong cùng 1 hàng hay 1 cột Nói 1 cách khác: trong bảng
qui hoạch đo không được có hai ô giống nhau:
A1 a2 a3 a4 b1
C1 y1111,y1112 y1113
c2 y2121,y2122 y2123
c3 y3131,y3132 y3133
c4 y4141,y4142 y4143
b2 C2 y1221,y1222
y1223
c3 y2231,y2232 y2233
c4 y3241,y3242 y3243
c1 y4211,y4212 y4213
b3 C3 y1331,y1332
y1333
c4 y2341,y2342 y2343
c1 y3311,y3312 y3313
c2 y4321,y4322 y4323
b4
C4 y1441,y1442 y1443
c1 y2411,y2412 y2413
c2 y3421,y3422 y3423
c3 y4431,y4432 y4433
Qui hoạch hoá đo theo phương pháp ô vuông Latin dùng phương pháp phân tích phương sai để đánh giá Cách tính phương sai của phương pháp ô vuông Latin 3 nhân tố, mỗi nhân tố 4 mức , làm theo như qui hoạch ở bảng trên , cho ở bảng sau:
Yếu tố F X X
n i
Trang 40A1: Tổng các giá trị y ( y là giá trị trung bình của 3 lần thử nghiệm lặp của cùng điều kiện
theo một ô ) có mức a1 tham gia (tức là tổng trung bình các kết quả của các ô trong cột a1)
Tương tự, ta tính các giá trị khác là:
A2, A3, A4 là tổng của các kết quả có mức a2, a3, a4 tham gia tương ứng
B1, , B4 là tổng của các kết quả có mức b1, b2, b3, b4 tham gia tương ứng
C1, , C4 là tổ của các kết quả có mức c1, c2, c3, c4 tham gia tương ứng
Phương pháp này được sử dụng rất phổ biến trong đo nông nghiệp, lâm nghiệp, sinh
học, y học và xã hội - tâm lí học
Ví dụ 27: Qui hoạch ghoá đo theo phương pháp Ô vuông Latin, 3 yếu tố, mỗi yếu tố 4 mức
B1 b2 b3 B4 Hàng
A1
c1 13,2
c2 2,7
c3 49,2
c4 7,2 72,2
A A2
c2 19,0
c3 8,0
c4 15,3
c1 9,5 52,0 A3
c3 4,6
c4 5,9
c1 31,5
c2 53,1 95,1 A4
c4 14,7
c1 16,3
c2 60,9
c3 55,2 147,1 Tổng Cột 51,5 32,9 157,0 125,0