1. Trang chủ
  2. » Khoa Học Tự Nhiên

NHẬP MÔN XỬ LÝ SỐ LIỆU VÀ KẾ HOẠCH HÓA THỰC NGHIỆM

157 2,1K 21

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 157
Dung lượng 3,65 MB

Nội dung

PHẦN I: THỐNG KÊ VÀ PHÂN TÍCH THỐNG KÊ SỐ ĐO Chương 1: Các đặc trưng thông kê của một tập số liệu kết quả đo. 1.Các tham số đặc trưng về sự tập trung của tập số liệu. 1.1.Tần xuất (pi) 1.2.Số trội (Mo). 1.3.Khoảng của tập số (R) 1.4.Số trung vị (Med) và số tứ phân vị (Q). 1.5.Trung bình cộng(X). 2.Các tham số đặc trưng về sự phân tán của tập số liệu. 2.1.Phương sai (σ2 hoặc S2). 2.2.Độ lệch chuẩn (σ f hoặc Sf).

Trang 2

Chương 1: Các đặc trưng thông kê của một tập số liệu kết quả đo

1.Các tham số đặc trưng về sự tập trung của tập số liệu

2.Các tham số đặc trưng về sự phân tán của tập số liệu

2.1.Phương sai (σ2 hoặc S2)

2.2.Độ lệch chuẩn (σ f hoặc Sf)

2.3.Độ sai chuẩn (σx hoặc Sx)

2.4.Hệ số biến thiên (Cv)

3.Các đặc trưng phân phối thống kê của tập số liệu

3.1.Phân phối Chuẩn (phân phối Gauss)( u )

3.2.Phân phối Student (phân phối t)

3.3.Phân phối Fisher

3.4.Phân phối Khi bình phương

3.5.Phân phối Poisson

3.6.Phân phối Nhị thức

3.7.Mối quan hệ giữa các hàm phân phối và các chuẩn phân phối

Chương 2 :Phân tích đánh giá tập số liệu kết quả đo

4.1.Sai số đo

4.2.Độ chính xác của tập số liệu kết quả thực nghiệm

4.3.Độ sai biệt của tập số liệu kết quả thực nghiệm

4.4.Sai số tối đa cho phép ΔP(X)

4.5.Khoảng chính xác tin cậy

4.6.Khoảng giới hạn tin cậy của một tập số liệu kết quả đo

Chương 3 : Phân tích so sánh cặp tham số đặc trưng của hai tập số liệu kết quả đo

5.1.Giả thiết thống kê và kết luận thống kê

5.2.Quan hệ giữa chuẩn phân phối và kết luận thống kê

5.3.Phân tích so sánh

5.3.1.So sánh độ chính xác

5.3.2.So sánh sai biệt

PHẦN II: PHÂN TÍCH NHÂN TỐ ẢNH HƯỞNG LÊN SỐ ĐO

Chương 4 : Phân tích Hồi qui và Tương quan của các nhân tố

6.1.Hồi qui và Tương quan hai nhân tố

6.1.1.Hồi qui tuyến tính

6.1.2.Hồi qui phi tuyến tính

6.1.3.Hệ số tương quan (r) Spearman

6.1.4.Hệ số tương quan thứ bậc Spearman rho

Trang 3

6.2.Hồi qui và tương quan đa nhân tố

chương 5: Phân tích tác động của các nhân tố qua tham số

( phân tích bằng phương sai )

7.1.Bài toán 1 yếu tố, k mức đo,mỗi mức đo lặp lại n lần

7.2.Bài toán 2 yếu tố A và B; yếu tố A, k mức đo; yếu tố B, m mức đo; với mỗi mức của 2 yếu tố A và B đều tiến hành đo lặp lại n lần

7.3.Bài toán 3 yếu tố trở lên ( Phương pháp Ô vuông Latin)

Chương 6 : Phân tích tác động của các nhân tố không qua tham số

8.1.Bài toán tỷ lệ giữa 2 đại lượng, mỗi đại lượng 2 mức

8.1.1.Dùng chuẩn Khi bình phương ( χ2 ) để đánh giá

8.1.2.Dùng Hệ số tương quan để đánh giá

8.2.Bài toán tỷ lệ giữa 2 đại lượng X ( có s mức ) và Y ( có r mức )

8.3.Bài toán so sánh 2 tỷ lệ

PHẦN III- KÊ HOẠCH HOÁ THỰC NGHIỆM

Chương 7: Mô hình hoá thực nghiệm đa nhân tố bậc một đầy đủ và rút gọn

9.1 Đại cương về mô hình hoá thực nghiệm đa nhân tố

9.2.Mô hình hoá thực nghiệm bậc 1 đầy đủ :

9.3 Mô hình hoá thực nghiệm bậc 1 rút gọn:

Chương 8: Mô hình hoá thực nghiệm đa nhân tố bậc hai đầy đủ hay rút gọn

10.1- Mô hình hoá thực nghiệm bậc 2 tâm trực giao

10.2- Mô hình hoá thực nghiệm bậc 2 tâm xoay:

Chương 9 : Phương pháp mạng đơn hình

PHẦN IV- TỐI ƯU HOÁ THỰC NGHIỆM

10.1- Khái niệm và phân loại các phương pháp tối ưu hoá:

10.2.Phương pháp thực nghiệm theo đường dốc nhất

10.3 Phương pháp khảo sát mặt mục tiêu

10.4.Phương pháp thực nghiệm theo đơn hình

Phụ lục 1 : Các bài tập ôn luyện

Trang 4

PHẦN I

XỬ LÝ SỐ LIỆU KẾT QUẢ ĐO

CHƯƠNG 1

CÁC ĐẶC TRƯNG THỐNG KÊ CỦA MỘT TẬP SỐ LIỆU KẾT QUẢ ĐO

Những đại lượng đặc trưng chính cho một tập số liệu kết quả đo, được phân làm 3 loại

chính :1/ Các tham số đặc trưng về sự tập trung của tập số liêu, 2/ Các tham số đặc trưng về

sự phân tán của tập số liệu, 3/ Đặc trưng phân phối thống kê của tập số liệu

1 Các tham số đặc trưng về sự tập trung của tập số liêu:

1.1 Tần suất (p i ):

Giả thiết có một tập số liệu kết quả đo gồm có N số liệu, trong đó có ni giá trị Xi (Xi

xuất hiện ni lần) ni gọi là tần số của giá trị Xi, khi đó, tần suất của giá trị Xi được tính như sau:

Trang 5

Bảng biểu diễn số liệu thống kê 100 kết quả đo từ 100 đối tượng đã cho trên đây theo phân nhóm cách nhau khoảng 17 đơn vị một trình bầy như sau:

Nhóm Tần số Giá trị TB Tần suất Tần xuất dồn

Việc phân nhóm một tập số liệu được tiến hành qua một số bước:

Ví dụ 2: Trắc nghiệm môn toán được tiến hành đối với một lớp học Dới đây là điểm số của

Bước 2: Tính khoảng của nhóm : 36 : 10 = 3,6 , chẵn hoá là 4

Bước 3 : Tính khoảng của nhóm có giá trị nhỏ nhất: 12 + 3= 15 , ta có nhóm có giá trị nhỏ nhất là 12-15, tư dó xây dưng nên các nhóm có giá trị cao hơn, đếm các giá trị nằm trong tập

số liệu để tìm tần số của nhóm, kết quả ta có tập số liệu trên được phân nhóm như sau:

9 8 7 6 5 4 3 2

Trang 6

Số trội (Mo) là số có tần suất lớn nhất (chính là số có tần số xuất hiện lớn nhất ) trong

tập số liệu kết quả đo

1.3 Khoảng của tập số (R):

Khoảng của tập số ,R , là khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất của tập

số liệu kết quả đo Như vậy, khoảng của tập số được tính theo công thức sau:

R = Xmax - Xmin 1.2

1.4 Số trung vị (Med) và số tứ phân vị (Q):

Số trung vị (Med) là số đứng giữa tập số liệu đã được xắp xếp theo thứ tự từ bé đến

lớn, chia dãy số đó làm 2 phần bằng nhau về số số liệu

a/ Đối với các số liệu không nhóm lại :

Giả sử X1, X2 ,X3 Xn là dãy các giá trị của tập số liệu kết quả đo, được sắp xếp theo thứ tự tăng dần, thì :

-Số trung vị của tập N số lẻ được tính theo công thức sau:

2

1 N

XMed= + 1.3

Ví dụ 3 : Tìm trung vị của tập số : 5 , 7 , 9 , 1 3 , 1 5 , 1 6 , 1 9

Giải: Med = X(7+1)/2 = X4 , số thư 4 là số 13 vậy Med =13

-Số trung vị của tập N số chẵn được tính theo công thức sau:

[ ]

2

1

1 2

= XN XNMed 1.4

8 2

Med = (X4 +X5)/2 , vậy Med = (9 +13)/2 = 11

b/ Đối với số liệu gộp thành nhóm :

- Tìm trung vị tập số liệu có phân nhóm theo công thức sau:

Meadian ( 2 )

N cf

fm = Tần số ứng với khoảng điểm kế tiếp với khoảng điểm có tần số dồn được chọn

i = Giá trị khoảng điểm (interval)

Trang 7

Ví dụ 5: Tính giá trị trung vị cho tập số liệu sau:

5020232,5 ( ) 3 32,5 1,3 33,8

9

Meadian M

a/ Đối với các số liệu không nhóm lại :

-Số tứ phân vị của tập N giá trị chia hết cho 4, thì tính theo công thức:

]XX[2

1Q

1 4

N 4

1 4

N 3 4

N 3

N 3

Q

+

= 1.8

b/ Đối với số liệu gộp thành nhóm :

Giả sử nhóm thứ i ( Xi, Xi + 1 ) có ni giá trị nằm trong nhóm đó và ta có

nk

n2

Tương tự, các tứ phân vị được xác định theo công thức chung sau đây:

Trang 8

k k 1 k

1 k 1

i i (X X ) Xnk

n4

N.S

1 ( 4 )

N cf

N cf

Gọi X là giá trị trung bình cộng của một tập số liệu không phân nhóm thì X được

tính theo công thức sau:

Ví dụ 7: Điểm thi môn toán của 10 học viên thuộc nhóm khá là : 78, 79, 62, 84, 90, 71, 76,

83, 98, 77 Điểm trung bình của 10 học viên là:

1

10

779883767190846279

Trang 9

Trong trường hợp tập số liệu được phân nhóm, giá trị trung bình cộng được thính theo công thức tổng quát sau:

= ∑

+ + +

+ + +

f f

x f x

f x f

2 1

2 2 1

Trong đó : xi là giá trị trung bình của nhóm, fi tần số của nhóm

Ví dụ 8: Điểm thi trắc nghiệm của 100 học viên cho ở bảng sau:

Điển số Tần số Giá trị trung

bình nhóm

Tần số x giá trị trung bình nhóm

Công thức tính giá trị trung bình cho tập số liêu phân nhóm cũng dùng cho trường hợp tính giá trị trung bình gia quyền (có trọng số), khi đó fi trọng số của giá trị xi

Trong thực tế, người ta tính giá trị trung bình của một tập số liêu phân nhóm theo công thức sau:

i = Khoảng điểm (interval), N = Số lượng các trường hợp (Numbers)

Ví dụ 9: Tính số trung bình công của các điểm số được nhóm thành các khoảng điểm của tập số liêu sau

Trang 10

1.6 Trung bình nhân :

GMx = n x1x2x3 x n 1.17 Thường dùng để tính tốc độ tăng trung bình của tăng theo cấp số, sự pha loãng

Ví dụ 10: Thống kê số học viên tại chức đăng ký dự thi trong 4 năm của một cơ sở đào tạo cho ở bảng dưới đây Tính 1/ Bình quân số đăng ký dự thi trong 4 năm, 2/ Tốc độ đăng ký dự thi tăng bình quân trong 4 năm

1 1.18

Dùng để tính vận tốc, thời gian trung bình

Ví dụ 11: Trung bình 1 giờ, học viên A giải được 8 bài toán, học viên B giải được 7 bài toán, học viên C được 10 bài toán Tính tốc độ giải toán bình quân của 3 học viên trên

Giải:

HMx= 8,15

10

17

181

++

bài / 1 giờ

1.8 Trung bình của hệ : (trung bình gia quyền)

X h=

K B

A

k k B

B A A

N N

N

X N X

N X N

+ + +

+ + +

1.19 Dùng để tính trung bình của hệ gồm nhiều tập số liệu hoặc tập số liệu có trọng số

Ví dụ 12: Tính điểm bình quân của 5 lớp khối 10 thi môn Toán theo bảng dữ kiện sau:

Trang 11

2 Các tham số đặc trưng cho sự phân tán của tập số liệu :

2.1 Phương sai (σ2 hoặc S 2 ):

Phương sai là trung bình của tổng bình phương sai khác giữa các giá trị của tập số liệu

so với giá trị trung bình của tập số liệu kết quả đo:

2 i

'N

1

S 1.20

Với: N' = N khi N > 30 (σ2) N' = N - 1 khi N < 30 (S2)

N' có bản chất là bậc tự do của tập số liệu kết quả đo

công thức thực dụng để tìm phương sai:

2 N 1

i i2

i

N

)X( X({'N

)(

2 2

−+

−+

−+

+

B A

B B A

A B B A A

N N

X X N X X N S N S N

1.22

Trong đó : S*2A=

A

A A N

S

Phương sai đặc trưng cho sự sai biệt của các số liệu trong kết quả đo Phương sai càng

lớn, sai biệt càng lớn Ngược lại phương sai càng nhỏ thì sai biệt càng nhỏ

Phương sai còn biểu diễn độ phân tán của tập số liệu kết quả đo đối với giá trị trung

bình Phương sai càng lớn độ phân tán chung quanh giá trị trung bình càng lớn và ngược lại

2.2 Độ lệch chuẩn (σf hoặc S f ):

Độ lệch chuẩn của một tập số liệu kết quả đo là giá trị căn bậc 2 trị số phương sai của nó:

σf = σ2 hoặc Sf = S2 1.23

Độ lệch chuẩn có cùng thứ nguyên và cũng có ý nghĩa như phương sai

Trong thực tế, người ta hay tính độ lệch chuẩn theo công thức sau đây:

N

d N

x xi

=

2 2

) ( 1.24

Ví dụ 13: Xác định S của các điểm số không phân nhóm sau đây:

Trang 12

Mean = 83 5,89

10

34810

)83

Ví dụ 14: Tính độ lệch chuẩn của tập số liệu được phân nhóm sau đây

2.3.Độ sai chuẩn ( σ hoặc X S ): X

Độ sai chuẩn bằng độ lệch chuẩn chia cho căn bậc 2 của số giá trị kết quả đo:

N

f X

Trang 13

2.4.Hệ số biến thiên (C v ):

Hệ số biến thiên là tỷ số giữa độ lệch chuẩn với giá trị trung bình:

100.X

S

CV = f 1.26

Vì hệ số biến thiên không có thứ nguyên, cho nên có thể dựa vào hệ số biến thiên để

so sánh gần đúng độ sai biệt của các kết quả đo thu nhận được bằng các cách khác nhau

Khi độ lệch chuẩn lớn (Sf) ( tức sai biệt của các số liệu đo lớn), thì Cv lớn và ngược lại

Ví dụ 16: Đánh giá sự phát triển của trẻ 7 tuổi theo cân nặng trung bình là 20,37 kg với độ lệch chuẩn là 2,16 kg; trong khi đó, nếu đánh giá theo chiều cao trung bình là 113,64 cm với

độ lệch chuẩn là 4,04 cm Hỏi đánh giá nào mắc sai số lớn hơn?

Vậy theo cân năng mắc sai số lớn hơn

Ví dụ 17: 10 người học có điểm trung bình môn Toán và môn ngoại ngữ tương ứng là 85 và

72, trong khi đó học có độ lệch chuẩn của môn Toán và ngoại ngữ đều là 6,82

Tính Cv cho môn toán là:

Vậy, tuy có đô lệch chuẩn giống nhau, nhưng sai số đối với môn ngoại ngữ lớn hơn

3 Các đặc trưng phân phối thống kê của tập số liệu:

Đặc trưng phân phối thống kê của một tập số liệu kết quả đo là qui luật phân bố ngẫu nhiên của các giá trị kết quả đo trên trục số thực Đặc trưng phân phối thống kê là qui luật,

nên về mặt toán học nó thường được biểu diễn bằng một hàm số và có đồ thị tương ứng

Mỗi tập số liệu kết quả nghiện cứu là một tập số ngẫu nhiên (thường là rời rạc) có những đặc trưng phân phối thống kê riêng và thường tuân theo 1 trong 6 qui luật phân phối thống kê ngẫu nhiên phổ biến nhất, đó là:

3.1 Phân phối chuẩn (phân phối Gauss)( u):

- Hàm số của phân phối chuẩn được biểu diễn bằng phương trình toán học:

2 2

) X (2

1)X(

πσ

Trang 14

Trong đó:

X : là biến số ngẫu nhiên

μ : là hằng số, bằng giá trị kỳ vọng của biến ngẫu nhiên

σ : là hằng số, bằng giá trị phương sai của biến ngẫu nhiên

Gọi u là chuẩn Gauss và đặt:

πσ

Dạng chính tắc của hàm phân phối chuẩn là dạng của hàm phân phối chuẩn đã chuyển hệ toạ

độ từ Y(X) sang Y(u)

- Đồ thị của hàm phân phối chuẩn:

Nếu đặt σ là đơn vị của thang chia trục hoành mà giá trị của nó được xác định từ điểm uốn

của đường cong chuẩn hạ xuống trục hoành, μ là tham số đặc trưng cho sự tập trung các giá trị của hàm phân phối, thì hàm phân phối chuẩn có dạng chuông úp ( xem trang bên)

Hàm phân phối chuẩn có đặc diểm là: X ≅ Mo ≅ Med ≅ μ

- Dạng tích phân của hàm phân phối chuẩn:

)u(

P)u(Fdu)u(

Trang 15

-ý nghĩa hình học của tích phân là diện tích giới hạn bởi đường cong :

bởi đường cong cũng chính là độ tin cậy thống kê để xuất hiện Xi trong khoảng tích phân Kí hiệu độ tin cậy thống kê để xuất hiện giá trị Xi nằm trong vùng (- ∞, Xi) là P(Xj)

Độ tin cậy thống kê luôn là một số nhỏ hơn hoặc bằng 1 ( P(Xj) ≤1 )

Nếu kí hiệu ∝ là Độ không tin cậy thống kê, thì:

P + α = 1 hay P = 1 - α hoặc α = 1 - P

Khi P =1, điều đó có nghĩa là xác suất xuất hiện giá trị Xi là 100%

Trong xác suất, người ta qui ước:

Biến cố có P = 0.9999 là biến cố hoàn toàn chắc chắn

Biến cố có P = 0.999 là biến cố hết sức chắc chắn

Biến cố có P = 0.99 là biến cố rất chắc chắn

Biến cố có P = 0.95 là biến cố chắc chắn

Biến cố có P = 0.90 là biến cố có chiều hướng chắc chắn

Từ hàm phân phối chuẩn, khi cho một giá trị ui (X) thì ta tính được độ tin cậy thống kê

Pi, ứng với một diện tích Pi Ngược lại, khi cho giá trị Pj thì có thể tính được một giá trị uj(X) Thay cho tính toán, người ta lập sẵn những bảng số để tra giá trị u khi biết giá trị P hoặc ngược lại (xem phụ lục A)

3.2 Phân phối student (phân phối t):

Hàm số của phân phối student có dạng:

2

1 f 2

)f

t1(B),(y

u N

S X f

f f

=

= khi N ∞ thì S σ và t u 1.32

Sf là độ lệch chuẩn, Sx là độ sai chuẩn

Hàm phân bố t phụ thuộc vào biến số t là một biến ngẫu nhiên

f : bậc tự do (f = N - 1) ; B : là một hằng số

Sf: độ lệch chuẩn Vậy t bao giờ cũng phụ thuộc vào bậc tự do

Trang 16

- Đồ thị của hàm phân phối student:

Khi Xi là số có tần số rất lớn (tức là số có tần suất rất lớn) thì có thể suy ra gần đúng Xi ≅ X (giá trị có tần suất rất lớn thì giá trị của nó coi như trùng với giá trị trung bình)

Đồ thị của hàm Student giống như hàm phân phối chuẩn có dạng chuông úp Nó có đầy đủ các tính chất giống như hàm phân phối chuẩn Nhưng khác ở chỗ:độ nhọn của đồ thị hàm phân phối student phụ thuộc vào bậc tự do Y(p, f)

Bậc tự do càng lớn thì độ nhọn càng nhỏ và ngược lại Do độ nhọn phụ thuộc vào bậc

tự do, nên giá trị chuẩn t cũng phụ thuộc vào bậc tự do t(p,f).Trong thực tế, người ta nhận thấy :

N > 30: tuân theo phân phối chuẩn

N < 30: tuân theo phân phối Student

Đối với phân phối Student cũng có bảng tra chuẩn Student tính sẵn Dựa vào bảng này, khi biết hai trong ba giá trị t, f và P thi xác định được giá trị còn chưa biết

Có 2 loại bảng tra giá trị t (gọi là bảng phân vị của chuẩn t) Khi giả thiết thống kê đặt là :

* Nếu giả thiết : *Nếu giả thiết :

-H0 : Xi = Xk -H0 : Xi = Xk

-Ha : Xi > Xk hoặc Xi < Xk -Ha : Xi ≠ Xk

Thì tra bảng phân vị Thì tra bảng phân vị

của chuẩn t theo 1 phía của chuẩn t theo 2 phí

3.3 Phân phối Fisher

Hàm số của phân phối Fisher có dạng:

Y(F, f1, f2) = A

2 f f 1 2

) 2

2 (

2 1 1

)f(f

+

f F

1.28

Trong đó: F là biến số ngẫu nhiên; f1, f2 là các bậc tự do ; A là hằng số phụ thuộc f1 và f2

F phụ thuộc vào hai loại bậc tự do và được tính theo công thức sau

Trang 17

1

f 2 f 2

2 2

2 1S

SF

Tuỳ thuộc vào bậc tự do mà đồ thị có các dạng khác nhau Hàm phân phối Fisher cũng

có tính chất như các hàm phân phối khác Diện tích giới hạn bởi đường cong cũng biểu diễn

độ tin cậy thống kê

Người ta cũng lập các bảng tra sẵn, khi cho (P, f1 và f2) sẽ tra được giá trị của chuẩn

F, ngược lại cho 3 trong 4 thông số ( F,P,f1,f2 ) sẽ tra được số thứ 4 chưa biết

Có 2 loại bảng số chính để tra chuẩn F: Bảng F(0.95,f1, f2) và bảng F(0.99,f1,f2) (xem phụ lục A)

3.4 Phân phối Khi bình phương:

Hàm số của phân phối Khi bình phương có dạng:

2

2 f 2 2

(Y

2 f

i

2 (X X) Khi lấy các giá trị : 0 < χ < + ∞ 1.35 Hàm Khi bình phương chỉ phụ thuộc vào 1 bậc tự do

Đồ thị của hàm phân phối Khi bình phương có dạng:

Nếu cho trước độ tin cậy thống kê P và giá trị f, tra bảng sẽ tìm được giá trị χ2 và ngược lại

x

0 5

15 10

5 0

f(x)

7 5

3 1

Trang 18

3.5 Phân phối Poisson:

-Hàm số của phân phối Poisson có dạng:

!X

e.)X(

n = số lần biến cố A xuất hiện

Khi đó: nếu X là biến ngẫu nhiên có đặc trưng phân phối thống kê với tham số ( N,p )

là phân phối nhị thì:

- Kì vọng của biến ngẫu nhiên X là: Np

- Phương sai của biến ngẫu nhiên X là : σ2 = Npq

- Độ lệch chuẩn của biến ngẫu nhiên X là : σ= Npq 1.38

- Độ sai chuẩn của biến ngẫu nhiên X là: σx = pq

-Đồ thị của hàm phân phối nhị thức có dạng :

Cần phân biệt khái niệm hàm phân phối và chuẩn phân phối (chuẩn thống kê):

- Hàm phân phối là qui luật phân bố số liệu kết quả đo có tính ngẫu nhiên (các biến ngẫu nhiên)

- Chuẩn phân phối (chuẩn thống kê) là những giá trị của hàm phân phối tính được theo điều kiện cho trước

Trang 19

Như vậy chuẩn phân phối có 2 dạng: Giá trị tra bảng và Giá trị tính được

Người ta so sánh giữa giá trị tra bảng và giá trị tính được để đánh giá độ tin cậy thống

kê của một sự kiện, theo điều kiện cho trước (theo giá trị tra bảng)

3.7 Mối quan hệ giữa các hàm phân phối và các chuẩn phân phối:

Ta có nhận xét, một tập số liệu kết quả thực nghiệm phụ thuộc vào bậc tự do:

+ 2 bậc tự do thì tuân theo hàm F

+ 1 bậc tự do thì tuân theo hàm t hoặc χ 2 + Không phụ thuộc vào tự do thì tuân theo hàm u hoặc P

Trong thực nghiệm, cách xác định định tính luật phân phối của 1 tập số liệu kết quả

đo như sau:

-Nếu N >30 và có 1 trong 3 tính chất sau thì tập số liệu kết quả đo có qui luật phân

phối chuẩn:

1/ Đồ thị phân phối tần suất có dạng chuông

2/ Mo ≅ Med ≅ X

3/ Xi nhận các giá trị ở ngoài khoảng X ± 2 σ là 5% hoặc

Xi nhận các giá trị nằm ngoài khoảng X ± 3 σ là 1%

-Nếu N < 30 và có 1 trong 3 tính chất trên thì tập số liệu kết quả đo có qui luật phân

phối Student

Sơ đồ sau đây cho thấy các qui luật phân phối thống kê đã trình bày chỉ là 1 trường

hợp riêng của nhau mà thôi:

Phân phối F 2

2

2 1

X

t f = −μ

2

S

f 2N

2 =

χ Y(χ2 ,f) f= ∞ f = 1

Y(t,f) →Y(u) Y( χ2 ,f) →Y(u)

! X

Trang 20

CHƯƠNG 2

ĐÁNH GIÁ TẬP SỐ LIỆU KẾT QUẢ ĐO

Một tập số liệu kết quả đo có thể được phân tích đánh giá thông qua các đại lượng chính sau đây:

4.1 Sai số đo:

Có 4 loại sai số đo:

- Sai số tuyệt đối:

εA = Xi - X ≡ Xi - μ 2.1

Sai số tuyệt đối là sự sai khác của một giá trị đo nào đó với giá trị trung bình

( hoặc giá trị thật ) Sai khác này có thể là âm hoặc dương

- Sai số tương đối:

.100

X

X100.X

Sai số tương đối là tỷ số của sai số tuyệt đối đối với giá trị trung bình Sai số này

không có thứ nguyên cho nên được dùng để so sánh sai số tương đối của các phương pháp đo cho kết quả không cùng thứ nguyên

- Sai số hệ thống:

ΔX = X - μ ≠ 0 2.3

Nếu hiệu số này là đáng tin cậy tức là khác không là đáng tin cậy thì số đo đã mắc sai

số hệ thống Khi đó giá trị Xi tập trung về một phía của giá trị thực trên trục số Sai số hệ thống có thể tìm được nguyên nhân gây sai số hệ thống để loại bỏ

- Sai số ngẫu nhiên:

ΔX = X - μ ≈ 0 2.4

đo mắc sai số ngẫu nhiên khi hiệu số giữa giá trị trung bình cộng X với giá trị thật

gần bằng không là đáng tin cậy Khi đó các giá trị Xi phân bố đều hai phía của giá trị thực trên trục số Sai số ngẫu nhiên bao giờ cũng mắc phải và chỉ có thể tìm các giải pháp để giảm sai

số ngẫu nhiên

4.2 Độ chính xác của tập số liệu kết quả đo

Vì trung bình cộng biểu diễn độ tập trung của các giá trị thực nghiệm nên độ chính xác của tập số liệu kết quả đo được đánh giá thông qua giá trị trung bình cộng Giá trị trung bình cộng mà sai khác với giá trị thật càng nhỏ thì độ chính xác của số đo càng lớn và ngược lại

Nguyên nhân dẫn đến độ chính xác kém có thể là:

- Chọn mẫu không đúng về chất lượng và số lượng

- Giải pháp đo số liệu không chính xác

4.3.Độ sai biệt của tập số liệu kết quả đo:

Vì phương sai biểu diễn độ sai biệt trung bình của các giá trị trong tập số liệu kết quả

đo so với giá trị trung bình Phương sai càng nhỏ thì độ sai biệt càng nhỏ và ngược lại

Nguyên nhân chính dẫn đến độ sai biệt lớn:

- Chọn mẫu về chất lượng và số lượng không đặc trưng cho mục tiêu đo

- Tay nghề người làm đo kém, không thu thập được số đo

Trang 21

Thực ra giá trị trung bình cộng X cũng phản ánh phần nào độ sai biệt khi so với giá

trị thật và ngược lại giá trị phương sai S2 cũng phản ánh phần nào độ chính xác khi độ sai biệt

nhỏ Tuy nhiên mỗi đại lượng có tính trội biểu diễn cho độ chính xác và độ sai biệt khác nhau:

X có tính trội phản ánh độ chính xác, S2 có tính trội phản ánh độ sai biệt

Hình vẽ minh hoạ độ chính xác và độ sai biệt

Độ sai biệt (Precision) : Cực kỳ nhỏ lớn nhỏ

Độ chính xác (Accuracy): Cực kỳ tốt Tốt Tồi

Kết luận : Đúng - Tốt Sai số ngẫu nhiên Sai số hệ thống

4.4 Sai số tối đa cho phép ΔP(X)

Sai số tối đa cho phép ΔP(X) của một tập số liệu kết quả đo được qui định: cho phép

lấy các giá trị Xi sai khác với giá trị trung bình X lớn nhất là ±3σ Nó phản ánh tính thống

kê của kết quả đo Sai số tối đa cho phép chia làm hai loại:

+ Sai số tối đa cho phép tuyệt đối:

)X(

P = ± σ

Δ

2.6

Sai số tối đa cho phép tương đối được biểu diễn dưới dạng phần trăm (%) do đó không

còn thứ nguyên, dùng để so sánh sai số tối đa cho phép tương đối của phương pháp đo này với

sai số tối đa cho phép tương đối của phương pháp đo khác

Những giá trị kết quả đo nào nằm ngoài khoảng sai số tối đa cho phép tuyệt đối thì

phải loại bỏ (và gọi các giá trị đó đã mắc sai số thô )

4.5 Khoảng chính xác tin cậy:

Khoảng chính xác tin cậy được tính theo công thức sau:

ΔX(P,f) = X - μ = t(P,f).Sx 2.7

Trong đó:

P: độ tin cậy thống kê

f: bậc tự do của tập số liệu kết quả đo

x

S : Độ sai chuẩn

Khoảng chính xác tin cậy của một tập số liệu kết quả đo chính là khoảng sai khác giữa

giá trị trung bình với giá trị có một độ tin cậy thống kê cho trước Như vậy khoảng chính xác

tin cậy của 1 tập số liệu kết quả đo phụ thuộc vào độ tin cậy thống kê (P) và bậc tự do (f)

Khoảng chính xác tin cậy của mỗi giá trị kết quả đo được tính như sau:

ΔXi(P,f) = Xi - X = t(P,f).Sf 2.8

t(P,f): là giá trị tra ở bảng phân vị của hàm phân phối Student

Trang 22

Khi một tập số liệu kết quả đo có khoảng chính xác tin cậy không thoả mãn với độ tin cậy thống kê (P) cho trước thì có thể tăng thêm số mẫu (N) đo Số mẫu đo cần thiết để có khoảng chính xác tin cậy trùng với khoảng chính xác tin cậy lý thuyết cho trước, được tính theo công thức sau:

2 f

X

Sf,P(tN

= Trong đó: ΔX là cho trước 2.9

4.6 Khoảng giới hạn tin cậy của một tập số liệu kết quả đo:

Khoảng giới hạn tin cậy của một tập số liệu kết quả đo được qui định nằm trong khoảng:

X ± ΔX(p,f) = X ± t(p,f) Sx 2.10

Giá trị Xi bất kỳ của một tập số liệu kết quả đo được chấp nhận theo độ tin cậy thống

kê P cho trước, có bậc tự do f = N-1 phải luôn nằm trong khoảng giới hạn tin cậy và thường được biểu diễn như sau:

a/ Tinh các đại lượng đặc trưng của tập sô liệu trên

b/ Phân tích đánh giá tập số liệu

Trang 23

CHƯƠNG 3

SO SÁNH CẶP THAM SỐ ĐẶC TRƯNG CỦA HAI TẬP SỐ LIỆU KẾT QUẢ ĐO

5.1 Giả thiết thống kê và kết luận thống kê:

5.1.1.Giả thiết thống kê:

Giả sử ta có Xi và Xk là 2 tham số đặc trưng của 2 tập số liệu kết quả đo Xuất hiện 2 giả thiết thống kê, trình bầy ở bảng sau:

Giả thiết thống kê Ký hiệu í nghĩa Biểu diễn

Giả thiết không

(giả thiết không liên quan) H0 Xi ≡ Xk Xi - Xk ≡ 0

Giả thiết khác không

(giả thiết liên quan) Ha (H1) Xi ≠ Xk

Bác bỏ H 0 ; Chấp nhận H a

Kết luận thống kê loại 2:

Chấp nhận H 0 ; Bác bỏ H a H0

(Xi ≡ Xk) Ha (Xi ≠ Xk) Sai (Sai lầm loại 1)

Đúng

Ha

(Xi ≠ Xk) H0 (Xi ≡ Xk) Đúng Sai ( Sai lầm loại 2)

+ Kết luận thống kê loại 1: Phủ định H0 (bác bỏ H0) và Khẳng định Ha (chấp nhận Ha) Kết luận thống kê loại 1 dẫn đến sai lầm loại 1, đó là Đúng là H0 (xi ≡xk) lại kết luận là Ha (xi

≠ xk) Nói một cách khác: đúng là chúng giống nhau lại bảo chúng khác nhau.”

+ Kết luận thống kê loại 2: Phủ định Ha (bác bỏ Ha).Khẳng định H0 (chấp nhận H0)

Kết luận thống kê loại 2 dẫn đến sai lầm loại 2, đó là đúng là Ha (Xi ≠ Xk) lại kết luận là H0 (Xi ≡ Xk) Nói một cách khác : đúng là chúng khác nhau lại kết luận chúng giống nhau

Cần nhớ rằng : Kết luận thống kê là khẳng định ( hay chấp nhận ) một giả thiết thống

kê này và phủ nhận ( hay bác bỏ ) giả thiết thống kê kia, chứ không có nghĩa là cho rằng giả thiết thống kê này đúng còn giả thiết thống kê kia sai

Trong trường hợp buộc phải kết luận thống kê thì phải giữ nguyên tắc: thà mắc sai

lầm loại 1 còn hơn mắc sai lầm loại 2 Nói cách khác: nếu không đủ bằng chứng để khẳng định giả thiết H0, thì thà phủ nhận giả thiết H0, còn hơn khẳng định giả thiết H0.

Trang 24

5.2 Quan hệ giữa chuẩn phân phối và kết luận thống kê

Các chuẩn phân phối có thể tính được từ các số liệu của tập số liệu kết quả đo:

XX

xS

S

S

f i N 1 i ) , P (

S

XX

=

=

Sơ đồ quan hệ giữa chuẩn phân phối và kết luận thống kê:

- Nếu t tính < t bảng nghĩa là độ tin cậy thống kê của ttính nhỏ hơn độ tin cậy thống kê của tbảng vậy thì ttính không đáng tin cậy bằng tbảng

Do ttính không đáng tin cậy bằng tbảng nên hiệu số X - μ không đáng tin cậy, điều đó

có nghĩa sự khác nhau giữa giá trị trung bình và giá trị thật là không đáng tin cậy Vì chúng khác nhau không đáng tin cậy cho nên có thể coi như chúng giống nhau (chấp nhận H0, phủ nhận Ha)

- Nếu t tính > t bảng , thì ttính có độ tin cậy thống kê lớn hơn độ tin cậy thống kê của tbảng

Vì vậy ttính đáng tin cậy và do đó hiệu số X - μ chỉ sự sai khác giữa X và μ là đáng tin cậy (phủ nhận H0, chấp nhận Ha)

- Nếu t tính = t bảng thì độ tin cậy bằng nhau cho nên X - μ thoả mãn độ tin cậy thống kê cho trước Nói cách khác độ chính xác tin cậy của tập số liệu kết quả đo thoả mãn độ tin cậy

t t = t b f(x)

t b < t t

Trang 25

thống kê cho trước Trong trường hợp này, chúng ta chọn thà mắc sai lầm loại 1 còn hơn mắc sai lầm loại 2 để kết luận thống kê Nghĩa là thà kết luận X khác μ hơn là kết luận X giống

μ để chọn quyết định cho phù hợp

Do tbảng phụ thuộc độ tin cậy thống kê ( P ) cho trước, nên một kết luận thống kê rút ra được chỉ ứng với một độ tin cậy thống kê cho trước mà thôi Khi độ tin cậy thống kê thay đổi thì kết luận thống kê cũng có thể thay đổi theo

Lập luận về quan hệ giữa chuẩn phân phối t và kết luận thống kê cũng áp dụng cho các chuẩn phân phối khác Và việc sử dụng các chuẩn phân phối của các hàm phân phối để kết luận thống kê cho đúng - gọi là kiểm định thống kê (xem các ví dụ cuối chương)

Ví dụ 19: Sử dụng 4 kết quả đo A,B,C và D Kết quả làm lặp lại theo mỗi đo 6 lần thu được trình bày trong bảng sau :

a/ Tính giá trị Trung bình và Phương sai của mỗi đo và nhận xét

b/ Biết giá trị thật là 18,1 Phân tích đánh giá sai số của mỗi đo

1,1805,18

1,1875,17

= = 6,48 >> tb ( 95,5 ) = 2,57

Kết luận : Ha : x ≠ μ → sai số hệ thống

Trang 26

Trong thực tế, người ta còn sử dụng giá tri độ tin cậy P-value để kết luận thống kê:

P-value một phía = 0,5000 (giá trị của z tại μ = 0) - giá trị tra bảng của z

P-value hai phía = 2(0,5000 - giá trị tra bảng của z)

Với : P-value ≤ α thì bác bỏ giả thiết H0 , chấp nhận Ha

P-value > α thì chấp nhận giả thiết H0 , bác bỏ Ha

Ví dụ 20: Điểm thi bài trắc nghiệm trung bình của khối 10 là 24, lấy ngẫu nhiên 36 thí sinh tính được giá trị trung bình là 24,7 với độ lêch chuẩn là 2 Đánh giá xem giá trị trung bình của các thí sinh này có khác của khối không?

Giải: - giả thiết H0 là μ ≤ 24 , Ha là μ > 24

- Tính giá trị 2,10

36/2

247,24

- Tra bảng z= 2,10 , tra được z (α =0.05)= ( 0,98214 - 0,5000 ) = 0.4821

- Tính hiệu: 0,5000 – 0,4821 = 0,0179, trong trường hợp 1 phía này đó chính là P-value

Vậy P-value = 0,0179 < 0,05 ( α ) , kết luận : bác bỏ H0 , nghĩa là 36 thí sinh này thực sự có điểm trung bình cao hơn khối 10

Ví dụ 21: Một nghiên cứu trẻ khuyết tật có chỉ số IQ trung bình là 80, kiểm tra lại với mẫu là

32 trẻ khuyết tật, cho thấy chúng có chỉ số IQ trung bình là 82, với độ lệch chuẩn là 6 Tại α=0.05 với mẫu kiểm tra như vậy có đủ độ tin cậy (P- value) để cho rằng nghiên cứu trên khác với mẫu kiểm tra không?

Giải: : - Giả thiết H0 là μ = 80 , Ha là μ ≠ 80

- Tính giá trị 1,89

32/6

8082

- Tra bảng z= 1,89 , tra được z (α =0.05)= ( 0,9706 – 0,5000) = 0.4706

- Tính hiêu: 0,5000 – 0,4706 = 0,0294 , trong trường hợp hai phía này, P-value cần nhân với 2

Vậy P-value = 2(0,0294) =0,0588 > 0,05 , kết luận: chấp nhận H0 , nghĩa là két quả nghiên cứu không khác với mẫu kiểm tra

5.3 So sánh cặp tham số đặc trựng của hai tập số liệu kết quả đo:

Có hai cặp tham số đặc trưng quan trọng nhất thường phân tích so sánh đó là:

* So sánh độ chính xác: Đặc trưng bởi X , khi đó có hai trường hợp chính:

1 So sánh X với μ

2 So sánh XA và XB

* So sánh độ sai biệt: đặc trưng bởi S2

Tuỳ theo NA và NB nhỏ hay lớn, giống nhau hay khác nhau, tiến hành so sánh theo cách khác nhau

Trang 27

B AS

XX

=

Với N > 30 dùng chuẩn u , còn N < 30 dùng chuẩn t

Cánh tính toán chuẩn u hoặc t và so sánh với các giá trị tra bảng được phân thành các trường hợp sau:

5.3.1.1 Nếu NA và NB > 30 Dùng chuẩn u để so sánh:

utính = d N

N

dd

f f

A d

f

N N

B A

N.N

NN

5.3.1.2 Nếu NA và NB < 30, dùng chuẩn t để so sánh chia làm hai trường hợp chính:

1/ Nếu NA NB <30 (giống trường hợp 3.1.1)

N

Sf

dSx

d)f,p(

)1N()1N(

)1N(S)1N(SSd

B A

B

2 B A

2 A

−+

−+

B A

B A

N.N

NN

d),p(t

f x

2 B

2

Trang 28

'N

2N

2N

2N

B A

SN'

duS

d),p(t

f x

dud

N 1

)dd(Sd

N 1 u

2 i

2N

2N

2N

B A

Phân tích đánh giá và phân tích so sánh 2 kết quả đo trên

Giải:

x = 32,72 A x = 31,89 B

S2B = 1,327 S2B = 0,619

*Không liên quan từng đôi một:

H0 = 2 kết quả đo không khác nhau

2 B

2

=

Trang 29

1,9

10

2973,0

83,02

=

=

=

N S

d t

d t

tb ( 0,95 ; 18 ) = 2,101 Kết luận tt < tb → chấp nhận H0

*Liên quan từng đôi một :

H0 = 2 kết quả đo không khác nhau

Ha = 2 kết quả khác nhau

0,83

10

3,8n

d

11010

3,889,121

nn

)d(dS

2 2

2 2

10

667.0

83,0NS

dtd

t = = =

tb ( 0,95 ; 9 ) = 2,26 → ttính > tb ⇒ chấp nhận Ha

tb ( 0,99 ; 9 ) = 3,25 → ttính < tb ⇒ bác bỏ Ha

Nhân xét : - Khảo sát liên quan từng đôi một cho thấy có sự sai khác, trong khi khảo sát

không liên quan từng đôi một thì không thấy sự khác nhau

- Khi thay đổi độ tin cậy thông kê thì có thể dẫn đến thay đổi kết luận thống kê

5.3.2 So sánh độ sai biệt:

Vì Phương sai đặc trưng cho độ sai biệt, nên so sánh độ sai biệt , chính là so sánh

phương sai Người ta sử dụng chuẩn Fisher để so sánh:

2

2 1 2 1

S

S)f,f,p(

F = (S12 >S22) 3.21 Khi đó:

Giả thiết H0: S12 = S22 được chấp nhận khi và chỉ khi F không đáng tin cậy

2

2 > 1 nên : S12 > S22

Việc so sánh Ftính và Fbảng luôn phụ thuộc vào độ tin cậy thống kê cho trước

Ví dụ 23 : Cho hai tập số đo A và B thu được từ kết quả nghiên cứu như sau :

Trang 30

B 4,29 4,52 4,57 4,56 4,66 - - -

17 18 19 20

A 4,80 4,36 4,75 4,22

B - - - -

a/ Tính các đại lượng đặc trưng của tập hai kết quả đo trên

b/ So sánh giá trị trung bình và giá trị phương sai của 2 đo A và B

0259,0S

S

2 B

6.1.Hồi qui và tương quan hai nhân tố :

Phân tích hồi qui và tương quan là tìm mối quan hệ giữa hai nhân tố X và Y xem chúng tuân theo qui luật nào (có thể được mô tả bằng mô hình toán học nào ) Các qui luật đó đều được biểu diễn bằng một hàm số Trong các tương quan, có tương quan tuyến tính được

sử dụng trong đo nhiều nhất

6.1.1 Hồi qui tuyến tính

Hồi qui tuyến tính giữa X và Y được biểu diễn bằng hàm số có dạng:

Y = aX + b 4.1

Để tìm hệ số a và b ta phải giải hệ phương trình :

∑Y = Nb + a∑X 4.2 ∑XY = b∑X + a∑X2

Giả hệ phương trình trên, hệ số a được tính theo công thức sau:

N

Y X Y

X X

X

Y Y X X a

i i

i i i

i N

i i

i N

i i

2 2

1

2

1

)(

)(

))(

(

4.3

Trang 31

Còn hệ số b được tính sau khi biết a theo phương trình :

b = Y - aX 4.4

6.1.2 Hồi qui phi tuyến tính :

Hồi qui phi tuyến giữa 2 nhân tố X và Y là một đường cong, có thể

mô tả bằng đường hồi qui Parabon, Hypebon hay Hàm số mũ

1/Hồi qui Parabon có dạng:

Y = aX2 + bX + c 4.5

Để tìm các hệ số a,b, và c, phải giải hệ phương trình :

∑Y = a∑ X2 + b∑X + Nc 4.6 ∑XY = a∑X3 + b∑ X2 + c∑X

Căn cứ vào các dữ kiện đo, lập bảng theo các cột : Y, X, (X-X ), (X- X )2, (X-X )3, (X-X )4 để tính cho nhanh và khỏi nhầm lẫnđể giải hệ phương trình trên

2/Hồi qui Hypebon có dạng :

Y = a/X + b 4.8

Để tìm các hệ số a và b, ta phải giải hệ phương trình :

∑Y = a∑1/X + Nb 4.9

∑Y/X = a∑1/X2 + b∑1/X

6.1.3.Hệ số tương quan (r) Spearman

Hệ số r, đánh giá mức độ tương quan giữa X và Y:

2

)(

)(

Y Y

X X a

a

r

i

i y

Dấu của hệ số tương quan:

r > 0 giữa X và Y có tương quan thuận

r < 0 gữa X và Y có tương quan nghịch

ý nghĩa của hệ số tương quan:

Trang 32

6.1.4 Hệ số tương quan thứ bậc Spearman rho:

Hệ số ρ, đánh giá mức độ tương quan thứ bậc có thông số hoặc không thông số giữa 2 nhân tố X và Y với N số liệu đo tính theo công thức sau:

)1(

)(6

di Hro 4.11 Trong đó:

- d là sự sai khác giữa Xi và Yi Để tính giá trị d, Xi phải được xếp theo thứ tự từ thấp đến cao hoặc ngược lại, còn Yi được xếp tương ứng từng cặp

- N số số liệu đo ( số giá trị Xi hay Yj )

Ví dụ 24: Khảo sát kết quả thi trắc nghiệm môn Toán (T) và môn Hoá (H) cuối học kì của 10 học sinh, cho ở bảng sau :

a-Tìm phương trình hồi qui tương quan tuyến tính,

b- Hệ số tương quan Spearman,

c- Hệ số tương quan Spearman rho

Vây phương trình hồi qui tuyến tính có dạng : y = 0.556 x + 13,97

b- Hệ số tương quan spearman :

697 1

1254 1 683 1 0 753

Trang 33

c-Hệ số tương quan Spearman hro:

6.2 Tính tương quan của sự kiện nhị phân:

Ví dụ 25: Lấy ngẫu nhiên 15 điểm môn Toan trong bảng điểm của một lơp học, kết quả cho ở bảng sau đây, trong đó có điểm của 9 Trai và 6 Gái :

độ lệch chuẩn của điểm số con trai tính ra là : σt =12.19, tỷ lệ con trai là p =9/15=0.6,

Tỷ lệ con gái là q= p-1 = 0,4 Tính điểm trung bình của Trai và Gái :

d = − = tra bảng tương quan nhi phân ta được: r( )13 0.05=0.514 vậy : r pb <r( )13 0.05,

Ta có thể kết luận là khả năng toán học của Tra và Gaí giống nhau

6.3.Hồi qui và tương quan đa nhân tố :

Phương trình hồi qui đa nhân tố ( n nhân tố ) có dạng tổng quát như sau :

Y=a0 +a in X i +a ijn X X i j +a ij nn X X i j X n +a ijn X i +a ijn X i n

2

1 1

1 1

1

Hồi qui và tương quan đa nhân tố cũng được phân thành hai loại tuyến tính và phi tuyến tính Việc giải các bài toán hồi qui và tương quan đa nhân tố cũng theo nguyên tắc có bao nhiêu hệ số phải có bấy nhiêu phương trình tham số để giải

Để có được các tham số để giải, người ta phải lập các ma trận thử nghiệm riêng ( ma trận tâm trực giao, ma trận tâm xoay ) và tiến hành thử nghiệm để có tập dữ liệu tương ứng cho việc giải

Trang 34

CHƯƠNG 5:

PHÂN TÍCH TÁC ĐỘNG CỦA CÁC NHÂN TỐ QUA THAM SỐ LÊN SỐ ĐO

( PHÂN TÍCH PHƯƠNG SAI )

Phương pháp phân tích phương sai (ANOVA) có hai loại bài toán phổ biến và coi như

là cơ sở cho các bài toán chung về phân tích phương sai

- Bài toán một nhân tố, k mức đo, mỗi mức đo làm lặp lại n lần và

- Bài toán hai nhân tố A và B, nhân tố A làm k mức đo, nhân tố B làm m mức đo, với

mỗi mức của 2 nhân tố A và B cũng tiến hành đo lặp lại n lần

- Bài toán ba nhân tố trở lên

7.1 Bài toán một nhân tố :

Bài toán này được mô tả bằng một bảng qui hoạch đo có dạng sau:

N A A1 A2 A3 Ai Ak

1 y11 Y21 Y31 yi1 yk1

2 y12 Y22 Y32 yi2 yk2

3 y13 Y23 Y33 yi3 yk3

J

n ∑ y2j

J

N ∑ y3j

So sánh sự sai khác giữa các giá trị kết quả đo (yij) do thay đổi các mức đo ( Ai ) của

nhân tố A, phương sai của sự thay đổi các mức đo ) với sai số đo (Phương sai của sai số đo)

có khác nhau đáng tin cậy hay không

Nếu khác nhau không đáng tin cậy, nhân tố A tỏ ra không ảnh hưởng lên kết quả đo,

và ngược lại, nếu khác nhau đáng tin cậy thì chứng tỏ nhân tố A đã ảnh hưởng lên kết quả đo

Sử dụng chuẩn Fisher để so sánh phương sai:

S12: Đặc trưng cho sự khác nhau của kết quả đo (yij) do sự khác nhau giữa các mức

(Ai) của A gây ra

S22: Đặc trưng cho sai số đo nói chung, vì làm nghiên cứu bao giờ cũng mắc sai số

f1: Bậc tự do của tổng số các mức đo đã làm f1 = k - 1

f2: Bậc tự do của tổng số các đo đã tiến hành qui hoạch đo f2 = k(n - 1)

Với: Ho: S12 S

2 2

; Ha: S12 S

2 2

≠ ;

Vì F luôn lớn hơn 1 ( F > 1 ), nên:

- Nếu Ftính < Fbảng thì Ftính không đáng tin cậy, tức là S12╪ S22 không đáng tin cậy cho nên chúng được coi là giống nhau Chúng không khác nhau cho nên nhân tố A khi

thay đổi mức đã tỏ ra không có ảnh hưởng đến kết quả đo

Trang 35

- Nếu Ftính > Fbảng thì Ftính đáng tin cậy, tức là S12 ╪ S22suy ra nhân tố A đã ảnh hưởng lên kết quả đo

Nhằm dễ tính toán, tránh nhầm lẫn, người ta lập bảng các công đoạn tính phương sai

để so sánh cho bài toán 1 nhân tố, k mức đo và n lần lặp lại như trên

Bảng trên thực chất đã sử dụng công thức tính phương sai:

S

X N

1

=

=

∑( ) 5.4

rồi tính Ftinh:

Ftính = S

S

A TN

2

2 so với Fbảng(P, fA, fTN) 5.6 trong đó fA = k -1; fTN = k(n-1)

7.2 Bài toán hai nhân tố :

Bài toán phân tích phương sai hai nhân tố:

Nhân tố A: k mức đo Nhân tố B: m mức đo Mỗi mức thử nghiệm lặp lại n lần Bảng qui hoạch đo của bài toán như sau:

A a1 a2 Ai Ak B1 y111,y112

, y11n

y211,y212 , y21n

yi11,yi12

.,yi1n

yk11,yk12 ,yk1n

yij1,yij2

., yijn

ykj1,ykj2 ,ykjn

Bm y1m1,

,y1mn

y2m1, .,y2mn

yim1, .,yimn

ykm1, .,ykmn

Trang 36

Phương pháp tính phương sai của qui hoạch đo 2 nhân tố cho ở bảng sau: Yếu tố F ∑(Xi - X )2 S2

- SA2: Đặc trưng cho ảnh hưởng của nhân tố A lên kết quả đo

- SB2: Đặc trưng cho ảnh hưởng của nhân tố B lên kết quả đo

- SAB2: Đặc trưng cho ảnh hưởng đồng thời của cả hai yếu tố A và B lên kết quả đo

- STN2: Đặc trưng cho sai số đo

Các bước tính phương sai theo bảng trên như sau:

Với: u: đo lặp lại thứ u i: mức đối với A j: mức đối với B

Công thức trên chính là tổng tất cả các kết quả đo trong một ô (1 ô là tương ứng mô

tả điều kiện đo xij theo mức A (ai) và mức B (bj) trong đó làm lặp lại n lần )

Y ij y u ij

u

n

2 1

2

=

=

∑( ) 5.8

Tổng tất cả các kết quả đo Tổng tất cả các kết quả đo

trong 1 hàng: trong 1 cột:

A i y u

u

n ij i

u

n ij j

1 1

Trang 37

Ví dụ 26 : Qui hoạch hai yếu tố : A, k mức; B, m mức; mỗi cặp mức làm lặp lại

14,0 13,2

9,5 8,6

B b3 7,3

8,5

38,2 37,7

5,1 5,9

54,4 55,2

20,8

60,1 60,9

19,6 18,5

58,2 59,7

Giải:

1- Tổng các giá trị trong 1 Ô vuông Latin :

a1 a2 a3 a4 Σ hàng b1 27,1 10,5 101,7 26,8 166,1 b2 39,1 37,7 27,2 18,1 122,1 b3 15,8 75,9 11,0 109,6 212,3 b4 40,8 121,0 38,1 117,9 317,8

Σ cột 122,8 245,1 178,0 272,4 818,3 2.Bình phương tổng các giá trị thực nghiệm trong 1 Ô:

b1 734,41 110,25 10342,89 718,24 b2 1528,81 1421,29 739,84 327,61

Trang 38

25,26451

13,54)

75,881

S

S F

Nhân tố f ∑( ) 2 S2

A

B

AB Sai số Tổng

568,16 881,75 843,01 3,38

Trang 39

249,41 (0,95;9,16) 2,65

38,3

01,843

SS

AB AB

Kết luận : yếu tố A, B và tương tức đồng thời AB đều ảnh hưởng mạnh lên kết quả đo

7.3 Bài toán ba nhân tố trở lên : Phương pháp Ô vuông Latin:

Trong trường hợp có ba nhân tố trở lên, người ta sử dụng phương pháp ô vuông la tinh

để xây dựng ma trận thử nghiệm.( Bảng qui hoạch thử nghiệm )

Bản chất của phương pháp ô vuông Latin là phương pháp phân tích phương sai nhưng

đã xây dựng bảng qui hoạch đo theo một qui luật riêng

Giả thiết có ba nhân tố A, B, C mỗi nhân tố có 4 mức nghiên cứu, Mỗi ô mô tả 1 điều kiện đo là tổ hợp các mức đo của 3 nhân tố Thí dụ: ô 1 khi làm đo A lấy mức a1, B lấy mức b1 C lấy mức c1

Nguyên tắc xây dựng qui hoạch đo theo ô vuông Latinh như sau: không được để cho

một điều kiện đo xác định lặp lại trong cùng 1 hàng hay 1 cột Nói 1 cách khác: trong bảng

qui hoạch đo không được có hai ô giống nhau:

A1 a2 a3 a4 b1

C1 y1111,y1112 y1113

c2 y2121,y2122 y2123

c3 y3131,y3132 y3133

c4 y4141,y4142 y4143

b2 C2 y1221,y1222

y1223

c3 y2231,y2232 y2233

c4 y3241,y3242 y3243

c1 y4211,y4212 y4213

b3 C3 y1331,y1332

y1333

c4 y2341,y2342 y2343

c1 y3311,y3312 y3313

c2 y4321,y4322 y4323

b4

C4 y1441,y1442 y1443

c1 y2411,y2412 y2413

c2 y3421,y3422 y3423

c3 y4431,y4432 y4433

Qui hoạch hoá đo theo phương pháp ô vuông Latin dùng phương pháp phân tích phương sai để đánh giá Cách tính phương sai của phương pháp ô vuông Latin 3 nhân tố, mỗi nhân tố 4 mức , làm theo như qui hoạch ở bảng trên , cho ở bảng sau:

Yếu tố F X X

n i

Trang 40

A1: Tổng các giá trị y ( y là giá trị trung bình của 3 lần thử nghiệm lặp của cùng điều kiện

theo một ô ) có mức a1 tham gia (tức là tổng trung bình các kết quả của các ô trong cột a1)

Tương tự, ta tính các giá trị khác là:

A2, A3, A4 là tổng của các kết quả có mức a2, a3, a4 tham gia tương ứng

B1, , B4 là tổng của các kết quả có mức b1, b2, b3, b4 tham gia tương ứng

C1, , C4 là tổ của các kết quả có mức c1, c2, c3, c4 tham gia tương ứng

Phương pháp này được sử dụng rất phổ biến trong đo nông nghiệp, lâm nghiệp, sinh

học, y học và xã hội - tâm lí học

Ví dụ 27: Qui hoạch ghoá đo theo phương pháp Ô vuông Latin, 3 yếu tố, mỗi yếu tố 4 mức

B1 b2 b3 B4 Hàng

A1

c1 13,2

c2 2,7

c3 49,2

c4 7,2 72,2

A A2

c2 19,0

c3 8,0

c4 15,3

c1 9,5 52,0 A3

c3 4,6

c4 5,9

c1 31,5

c2 53,1 95,1 A4

c4 14,7

c1 16,3

c2 60,9

c3 55,2 147,1 Tổng Cột 51,5 32,9 157,0 125,0

Ngày đăng: 28/03/2016, 22:10

TỪ KHÓA LIÊN QUAN

w