Khi phân tích hay xác định một mẫu thì người phân tích phải tiến hành một số phép thí nghiệm song song. Khi đó các kết quả riêng lẻ của phép xác định ngày càng gần nhau thì càng tốt và phải phù hợp với hàm lượng thực của mẫu ấy. Do đó có hai yêu cầu đối với người phân tích là: Căn cứ vào độ lặp của các kết quả thu được: Độ lặp lại (hay độ chính xác) phụ thuộc vào sai số ngẫu nhiên của phép phân tích. Nếu sai số ngẫu nhiên càng lớn thì độ tản mạn của các giá trị thu được khi lặp đi lặp lại phép phân tích sẽ càng lớn và độ chính xác của phép phân tích sẽ càng. Căn cứ vào sự phù hợp của kết quả đo với hàm lượng thực: Độ lệch khỏi hàm lượng thực của mẫu là do sai số hệ thống. Sai số ngẫu nhiên làm cho kết quả phân tích không chắc chắn, còn sai số hệ thống làm cho kết quả phân tích sai với giá trị thực. Vậy: Độ lặp lại (độ chính xác) và độ đúng của phương pháp phân tích cần được xem xét một cách kĩ càng, đặc biệt là phương pháp phân tích. Một phép phân tích phải có độ lặp và tính đúng đắn thoả mãn.
Trang 1CHƯƠNG I: SAI SỐ TRONG ĐO ĐẠC THỰC NGHIỆM
I.1 Mở đầu
Khi phân tích hay xác định một mẫu thì người phân tích phải tiến hành một số phép thí nghiệm song song Khi đó các kết quả riêng lẻ của phép xác định ngày càng gần nhau thì càng tốt và phải phù hợp với hàm lượng thực của mẫu ấy Do đó có hai yêu cầu đối với người phân tích là:
- Căn cứ vào độ lặp của các kết quả thu được: Độ lặp lại (hay độ chính xác) phụ thuộc
vào sai số ngẫu nhiên của phép phân tích Nếu sai số ngẫu nhiên càng lớn thì độ tản mạn của các giá trị thu được khi lặp đi lặp lại phép phân tích sẽ càng lớn và độ chính xác của phép phân tích sẽ càng
- Căn cứ vào sự phù hợp của kết quả đo với hàm lượng thực: Độ lệch khỏi hàm lượng
thực của mẫu là do sai số hệ thống Sai số ngẫu nhiên làm cho kết quả phân tích không chắc chắn, còn sai số hệ thống làm cho kết quả phân tích sai với giá trị thực
Vậy: Độ lặp lại (độ chính xác) và độ đúng của phương pháp phân tích cần được xem xét một
cách kĩ càng, đặc biệt là phương pháp phân tích Một phép phân tích phải có độ lặp và tính đúng đắn thoả mãn
I.2 Các phép đo
I.2.1 Phép đo trực tiếp:
Trong phép đo trực tiếp người ta so sánh mẫu cần đo với các mẫu chuẩn
Ví dụ, trong phép cân người ta so sánh mẫu cần đo với khối lượng các quả cân Trong
phép đo thể tích người ta so sánh dung tích của mẫu cần đo với dung tích của các pipet, bình định mức…
I.2.2 Phép đo gián tiếp:
Trong phép đo gián tiếp, nhờ số liệu của các phép đo trực tiếp các kết quả nhận được bằng cách tính toán nhờ một công thức xác định
Ví dụ, phép xác định khối lượng riêng là một phép đo Nhờ các kết quả của các phép
đo trực tiếp về khối lượng (m) và phép đo trực tiếp về thể tích (V), dùng công thức d = m/V
ta tính được khối lượng riêng (d)
I.2.3 Phép đo tập hợp:
Ngoài phép đo trực tiếp và phép đo gián tiếp người ta còn dùng phép đo tập hợp Trong phép đo tập hợp, nhờ số liệu của các phép đo trực tiếp, cùng một lúc có thể tính được nhiều đại lượng cần đo
I.3 Sai số trong đo đạc thực nghiệm
I.3.1 Độ lặp (độ chính xác) và độ đúng của phép phân tích:
Trong phép phân tích muốn cho các phép đo hữu hạn mà các giá trị thực nghiệm thu được là X1X2 …Xn thì phải có độ lặp tốt Vậy độ lặp của phép đo phản ánh sự phân tán của các giá trị thực nghiệm xung quanh giá trị trung bình
Mặt khác ta cũng mong muốn đại lượng trung bình cộng X gần với giá trị thực ( X) Độ đúng của một phép phân tích phản ánh mức độ phù hợp của đại lượng X với giá trị thực
Một phép đo có thể chính xác nhưng không đúng hay ngược lại Một phép đo tốt cần
có độ chính xác cao và độ đúng tốt
Sai số ngẫu nhiên ảnh hưởng đến độ chính xác của phép đo, trong khi đó thì sai số hệ thống ảnh hưởng đến độ đúng của phép đo
* Phân biệt độ đúng và độ chính xác:
- Một phép đo có độ đúng cao khi x càng gần
Trang 2- Một phép đo có độ chính xác cao khi số lần đo lặp lại cao Tuy nhiên không phải độ đúng cao thì nhất thiết có độ chính xác cao
I.3.2 Sai số ngẫu nhiên và sai số hệ thống
a) Sai số ngẫu nhiên:
Sai số ngẫu nhiên phát sinh do hàng loạt ngẫu nhiên không kiểm soát được và luôn luôn có mặt trong bất cứ phép đo nào
b) Sai số hệ thống:
Sai số hệ thống do nguyên nhân xác định gây ra và chúng ta có thể tăng giảm theo một chiều hoặc cố định không thay đổi Sai số hệ thống làm cho giá trị thực nghiệm không phù hợp với giá trị thực
I.3.3 Sai số tuyệt đối và sai số tương đối:
a) Sai số tuyệt đối: Là hiệu giữa giá trị trung bình và giá trị thực hoặc giá trị đáng tin cậy nhất: a = X – Tuỳ theo X lớn hay bé hơn mà ta có sai số dương hay âm b) Sai số tương đối: Là tỉ số giữa sai số tuyệt đối a và giá trị thực hoặc giá trị trung bình
q = 100% = 100%
c) Sai số thô: Là những sai số lớn do làm thực nghiệm như đọc sai quả cân, tính toán
nhầm đơn vị, lấy nhầm thể tích…
I.4 Số có nghĩa và cách ghi kết quả số liệu phân tích.*
I.4.1 Chữ số có nghĩa (CSCN):
Kết quả của một phép đo trực tiếp cũng như một thao tác phân tích phải được ghi chép sao cho người sử dụng số liệu hiểu được độ chính xác của phép đo Các số liệu được
ghi chép theo nguyên tắc: “Số liệu phải được ghi sao cho chỉ có số cuối cùng là bất định”
a) Ðể phản ánh mức độ tin cậy của một số đo thực nghiệm, ta chỉ được phép ghi số đo này
bằng các chữ số có nghĩa (CSCN)
b) Ðối với mỗi số đo đối với số đo thông thường, ta phân biệt hai loại chữ số có nghĩa sau:
- Chữ số có nghĩa không tin cậy: là chữ số đứng sau cùng về bên phải của số đo Chỉ có duy nhất một CSCN không tin cậy trong mỗi số đo
- Chữ số có nghĩa tin cậy: là tất cả các chữ số đứng trước CSCN không tin cậy và tận cùng
về bên trái bằng một chữ số khác chữ số 0
- Khi ghi một số đo thực nghiệm, chúng ta cần lưu ý đến vai trò của chữ số 0 Số 0 được dùng để thiết lập số thập phân thì không phải là số có nghĩa
0,28 ml : có 2 CSCN ; 5,40 ml : có 3 CSCN
- Một số đo có thể có một hay nhiều CSCN tin cậy Càng nhiều chữ số có nghĩa thì phép
đo càng chính xác
Thí dụ: Ðọc trên buret, ta ghi được số đo 12,65 ml Số này có tất cả 4 CSCN, phân
loại như sau: số 5 là CSCN không tin cậy; 1, 2, 6 là các chữ số có nghĩa tin cậy
Các chữ số 1, 2, 6 là CSCN tin cậy là vì trên buret có chia độ chính xác đến 0,1 ml thì
ai cũng đọc thấy rõ chữ số này Chữ số 5 thuộc loại CSCN không tin cậy vì nhiều người đọc phải ước lượng bằng mắt và do đó có sự chênh lệch, có khi đọc thành 12,64 ml hoặc 12,66 ml
Trang 3Vì vậy chúng ta không được viết 2,4g (2CSCN) = 2400mg (4 CSCN) mà phải viết
2,4g = 2,4.103mg Hoặc không được viết 7,3.103
(2 CSCN) = 7300 (4 CSCN)…
c) Xác định các CSCN trên các thang đo hiện số
I.4.2 Quy tắc làm tròn số cho số đo gián tiếp:
Số đo gián tiếp là số đo tính được từ các số đo trực tiếp thông qua biểu thức toán học nào đó Sai số của số đo trực tiếp lan truyền sang số đo gián tiếp nên ta phải ghi số đo gián tiếp cũng bằng những chữ số có nghĩa Khi tính toán thường có nhiều số lẻ, cần phải làm
tròn số Trong các phép tính chỉ được làm tròn ở kết quả cuối cùng
Chúng ta sẽ làm tròn số theo một số quy tắc sau:
a) Đối với phép cộng và trừ: Chỉ giữ lại kết quả cuối cùng một số chữ số thập phân đúng
bằng số chữ số thập phân của số hạng có số chữ số thập phân ít nhất
Thí dụ 1: 6,145 + 13,24 + 34,7 = 54,085 54,1
Thí dụ 2: Hãy tính phân tử lượng của BaO Biết Ba = 137,34; O = 15,9994
BaO = 137,34 + 15,9994 = 153,3394 = 15,34
b) Đối với phép nhân; chia: Chỉ giữ lại ở kết quả cuối cùng số chữ số có nghĩa của thừa số
có số chữ số có nghĩa ít nhất
Thí dụ 1: 6,125.10-5
x 3,7.10-8x5,37 = 1,21697625.10-11 1,2.10-11
Thí dụ 2: Chuẩn độ 10,00ml dung dịch HCl bằng dung dịch NaOH, 0,09215 M Thể
tích NaOH tiêu tốn là 2,45 ml Tính CHCl
CHCl = 0,09215 2,45x
= 0,0225767 10,00 0,0226 M (Số CSCNmin = 3)
Trang 4CHƯƠNG II: NHỮNG ĐẶC TRƯNG THỐNG KÊ
CỦA ĐẠI LƯỢNG NGẪU NHIÊN II.1 Các đại lượng trung bình (Mean):
II.1.1 Trung bình cộng: Giả sử sau n lần xác định ta được các giá trị X1, X2, …, Xn Giá trị trung bình cộng được tính theo công thức:
n i i=1
X
1
X =
n gọi là kì vọng mẫu
II.1.2 Trung vị (Median):
Khi các giá trị thực nghiệm được sắp xếp theo thứ tự tăng dần X1<X2<…<Xn thì trung vị sẽ là:
- Nếu n lẻ = 2k +1 thì trung vị là giá trị xk+1
- Nếu n chẵn = 2k thì trung vị là (xk + xk+1)/2
Giá trị trung vị không chịu ảnh hưởng của các giá trị ở hai đầu của các phép đo vì thế trung vị chỉ có thể đặc trưng cho dãy phép đo có n < 10 – thường gặp trong Hóa phân tích
II.2 Các đại lượng đặc trưng cho sự phân tán:
II.2.1 Phương sai (S 2 ) (Variance):
Trong hóa học, thường số đo có n 30 Phương sai được tính theo công thức:
2 i
i = 1
n
i
i = 1
n - 1 ( ) n - 1
Trong đó: n là số lần thí nghiệm; k = n – 1 gọi là bậc tự do
Xi là giá trị số liệu thí nghiệm thứ i; X là trung bình cộng của tập số liệu
Phương sai đặc trưng cho độ phân tán của số liệu Nếu phương sai càng nhỏ thì số liệu càng tập trung và ngược lại
II.2.2 Độ lệch chuẩn (S) (Standard deviation):
Độ lệch chuẩn là căn bậc 2 của phương sai, còn được gọi là sai số bình phương trung bình Đó là thước đo độ phân tán, được dùng hầu như thường xuyên trong hoá học phân tích
Nếu độ lệch chuẩn trung bình càng nhỏ thì số liệu càng tập trung và đó là điều mong muốn của người phân tích
II.2.3 Quy mô biến thiên (R) (Range):
Hiệu số giữa giá trị lớn nhất và nhỏ nhất của một dãy phép đo được gọi là quy mô
biến thiên R, tức là : R = x max – x min Quy mô biến thiên đặc biệt thích hợp để đặc trưng cho
độ phân tán khi mẫu có số phép đo nhỏ ( n < 10) – thường gặp trong Hóa phân tích
II.2.5 Độ lệch chuẩn của giá trị trung bình cộng SX :
n
2 2 i
i = 1
2 X
n n(n - 1)
II.2.5 Biên giới của độ tin cậy (độ chính xác) của phép đo:
= S t(p;k) X Trong đó, t(p;k) là giá trị của hàm phân bố Student (có bảng) ứng với xác suất p và bậc tự do k Giá trị thực nằm trong khoảng ( x - ε ; x + ε )
II.2.7 Sai số tương đối của phép đo (q%): ε
q = 100%
x
Trang 5CHƯƠNG III: PHÂN BỐ LÍ THUYẾT
PHÂN BỐ CHUẨN GAUSS III.1 Hàm phân bố (Distribution Function)
III.1.1 Hàm phân bố chuẩn (Normal
distribution function) - Gauss:
Hàm Gauss (x) (từ tập hợp tổng quát) với
biến số x và các thông số , :
(x) =
2
1 x - μ
-2 σ
1 e
σ 2π
(*)
II.1.2 Khoảng tin cậy và xác suất tin cậy
a
* Quy tắc 3 (ba xích ma): Từ bảng 2, khoảng (a,b) với a = - 3 và b = + 3 ứng với xác suất P = 0,997 Vậy xác suất để cho giá trị riêng lẻ X đi ra ngoài khoảng này là rất nhỏ
(chỉ bằng 0,3%) Những giá trị riêng nằm ngoài khoảng (a,b) này rất hiếm gặp Đó là nội
dung của quy tắc 3
- Quy tắc 3 có thể chuyển thành quy tắc 2, 4… tuỳ thuộc vào xác suất được chọn
Ví dụ: Một phép đo hàm lượng nguyên tố X cho các giá trị sau: 3,46; 3,48; 3,47; 3,57* (%)
Có loại bỏ giá trị 3,57 không nếu theo quy tắc 3 và 2? Phép đo có = 0,04%
III.2 Các hàm phân bố liên quan đến phân bố chuẩn
III.2.1 Hàm phân bố Student (Goselt – Người Anh, biệt danh Student):
Hàm phân bố chuẩn Gauss thích hợp cho tập hợp tổng quát (n ) Trong thực nghiệm nhiều khi các phép đo song song không đủ lớn, để tính độ lệch chuẩn S người ta đưa
ra hàm phân bố Student Hàm này có dạng:
t =
X
|X - μ| |X - μ|
S S μ = X ± t.S
n hay μ = X ± ε (với = t.S
n )
III.2.2 Hàm phân bố 2
(khi bình phương):
Hàm phân bố Gauss và Student cho phép ước lượng giá trị thực Hàm phân bố 2
cho phép ước lượng (độ lệch chuẩn tổng quát) từ S (độ lệch chuẩn mẫu) khi n nhỏ
2
=
n
2 i 2
i = 1
1 (X - X)
2 2
S (n - 1)
σ =
2 2
S k
σ
III.2.3 Hàm phân bố Fisher (F):
Giả sử có hai tập hợp mẫu {X1} có dung lượng n1 và {X2} có dung lượng n2 có các phương sai mẫu 2
1
S , 2 2
S Nếu hai tập hợp mẫu này thuộc cùng về một tập hợp tổng quát thì
sự sai khác giữa hai phương sai mẫu này phải mang tính chất ngẫu nhiên Fisher đề nghị biểu thị sự sai khác ngẫu nhiên này theo tỉ số F có dạng:
F =
2 1 2 2
S
S > 1
Hình dạng của hàm phân bố chuẩn
Trang 6CHƯƠNG IV: ĐÁNH GIÁ THỐNG KÊ
KẾT QUẢ THỰC NGHIỆM
IV Khái quát về phương pháp đánh giá thống kê
Các phương pháp kiểm định thống kê cho phép giải thích một cách khách quan các kết quả thí nghiệm Ví dụ, có hai kết quả trung bình X và I XII của hai kĩ thuật viên khi phân tích cùng một mẫu đồng nhất Muốn biết sự sai khác giữa XIvà XII mang bản chất ngẫu nhiên hay
hệ thống, cần phải dùng phương pháp kiểm định thống kê
Nếu cho rằng XIvà XII thuộc về cùng một tập hợp tổng quát thì sự sai khác của chúng phải mang bản chất ngẫu nhiên, được gọi là giả thiết Ho
Cần phải tuân thủ nguyên tắc:
- Khi bác bỏ H o thì chọn = 0,01, tức là p = 0,99
- Khi chấp nhận H o thì chọn = 0,05, tức là p = 0,95
- Khi nằm giữa p = 0,99 và p = 0,95 thì nên làm thêm thí nghiệm bổ sung rồi hãy kết luận
IV.2 Đánh giá khoảng tin cậy và độ chính xác của phép đo
Vì = S t(p;k) nên để đánh giá độ chính xác của 1 phép đo ta cần tính toán để thu X được các kết quả sau: ε = t(p;k).SX
X - ε < μ < X + ε
Ví dụ: Để đánh giá độ chính xác khi xác định %Ba trong BaCl2.2H2O thu được các kết quả %Ba: 56,24; 56,18; 56,09 Tính các đại lượng đặc trưng của tập số liệu (X, S2,
X
S , q)
- Chọn giá trị gần đúng C = 56,18 Lập bảng số liệu sau:
Ta có: 3
1
i
x
= -3.10-2;
3
1
2 i
x
= 117.10-4
- Giá trị trung bình tổng: X = C +
3
1
i
x
/n = 56,18 – 0,01 = 56,17
- Phương sai S2 =
3
1
2 i
1 n-1x = 5,85.10-3 SX Sn2 4,416.10-2
- Biên giới độ tin cậy: = t(p;k).S = 0,19 (với p = 0,95) X
- Vậy giá trị thực sẽ nằm trong khoảng: = (56,17 0,19) hay 55,98 < < 56,36
- Sai số tương đối của phép đo: q% = 0,19/56,17.100% = 0,34%
IV.3 Đánh giá sai số thô (sai số bất thường) của kết quả đo
IV.3.1 Đánh giá sai số thô theo chuẩn Đixon (Q):
Trong hoá học phân tích thường gặp các dãy số có số lượng phép đo ít, chuẩn Đixon cũng chỉ áp dụng tốt khi xác định sai số thô trong tập hợp mẫu có dung lượng 3 n 8
* Cách thực hiện:
- Sắp xếp các số đo theo trình tự từ nhỏ đến lớn: X1< X2<…< Xn Nghi ngờ X1 hoặc Xn
- Tính quy mô biến thiên R: R = Xmax – Xmin = Xn – X1
- Tính giá trị thực nghiệm:
Trang 7+ Nếu nghi ngờ X1: QT N = 1 2 1 2
n 1
=
X - X X - X
+ Nếu nghi ngờ Xn: QT N = n n-1 n n-1
n 1
=
X - X X - X
- Tra bảng tìm QLT = Q(p,n)
- So sánh QT N với QLT:
+ Nếu QT N < QLT Chấp nhận giá trị nghi ngờ (không được loại bỏ)
+ Nếu QT N > QLT Loại bỏ giá trị nghi ngờ
Ví dụ: Khi xác định hàm lượng than (Cgr) trong gang xám thu được kết quả %Cgr là:
Xi(%) = 2,86; 2,89; 2,91; 2,99; 2,90 Hãy xét xem có thể loại bỏ giá trị nào không?
Ta có dãy số đo tăng dần là: 2,86; 2,89; 2,90; 2,91; 2,99
- Tính R: R = 2,99 – 2,86 = 0,13
- QT N = 2,99 - 2,91
0,16 = 0,615
- Tra bảng ta có QLT = Q(p,n) = Q(0,95;5) = 0,64
- Ta có QT N < QLT Không loại bỏ giá trị 2,99
(Nếu p = 0,90 thì loại bỏ giá trị 2,99)
IV.3.2 Đánh giá sai số thô bằng phân bố Student
Để xác định đại lượng X ta cần làm (n+1) lần thí nghiệm và nhận được các giá trị sau:
X1<X2< <Xn<Xn+1 Giả sử Xn+1 (hoặc X1) khác rõ rệt với các giá trị Xi còn lại, ta cần kiểm tra giá trị Xn+1 (hoặc X1) có phạm sai số bất thường hay không? Việc xét có loại bỏ Xn+1 (hoặc X1) hay không thường được tiến hành theo các bước sau:
- Giả thiết Xn+1 ≠ X là do nguyên nhân ngẫu nhiên (khi tính X không kể giá trị Xn+1) với xác suất p = 0,95
- Tính S2 =
n 2 i
i = 1
x n
S = S = S
Tính giá trị tT N = n + 1
X
X - X
S
- So sánh tT N với t(p;k) với k = n:
+ Nếu tT N < t(p;k) thì Xn+1 ≠ X là do nguyên nhân ngẫu nhiên gây ra Chấp nhận kết quả Xn+1 tính lại các đặc trưng thống kê (có kể cả Xn+1)
+ Nếu tT N > t(p;k) thì Xn+1≠ X do nguyên nhân không ngẫu nhiên Loại giá trị Xn+1
Ví dụ 1: Đánh giá kết quả định lượng oxi (%) trong hợp kim của Titan với các số liệu
thực nghiệm sau: %Xi = 0,116; 0,118; 0,124; 0,118; 0,145
Ta hoài nghi giá trị x5 = 0,145
Tính các đặc trưng thống kê với 4 giá trị X1 X4 ta có:
X = 0,119; S2 = 9.10-6 S =X S n + 1
n = 3,35.10
-3
tT N = |0,145 – 0,119|/3,35.10-3 = 7,76 > t(0,95;4) = 2,78
Vậy X5 ≠ X không phải do nguyên nhân ngẫu nhiên Giá trị X5 phạm sai số thô, cần loại bỏ Tính lại các đặc trưng thống kê: X = 0,119; S2 = 1,2.10-5; S = 1,73.10X -3 và t(0,95;3) = 3,18 = 3,18.1,7.10-3 = 5,5.10-3
Vậy giá trị thực nằm trong khoảng 0,119 – 0,0055 < < 0,119 + 0,0055
Ví dụ 2: Xét ví dụ trong chuẩn Q: xét xem có nên loại giá trị 2,99 không?
Trang 8Ta có: X = 2,89; S2
= 1,4.10-3 S =X n + 1
S
n = 0,042
tT N = |2,99 – 2,89|/0,042 = 2,38 < t(0,95;4) = 2,78
Vậy không nên loại bỏ giá trị x = 2,99
IV.4 So sánh giá trị trung bình của các kết quả đo
IV.4.1 So sánh giá trị trung bình cộng với giá trị chuẩn a
Để tiến hành sự so sánh này phải trải qua các bước:
- Giả thiết X ≠ a là do nguyên nhân ngẫu nhiên ở một xác suất nhất định
- Tìm các tham số đặc trưng ( 2
X
X, S , S ) Tính tT N =
X
S
X - a
- So sánh tT N với t(p;k)
+ Nếu tT N < t(p;k) thì X ≠ a là do nguyên nhân ngẫu nhiên gây ra
+ Nếu tT N > t(p;k) thì X ≠ a do nguyên nhân không ngẫu nhiên
Ví dụ: Xác định %Ba trong BaCl2.2H2O bằng phương pháp mới thu được kết quả %Ba: 56,22; 56,13; 56,07 Đánh giá kết quả thu được khi cho giá trị thực a = 56,21%
Ta có: tT N = 1,61 tT N < t(p;k) = 4,3 nên X ≠ a do nguyên nhân ngẫu nhiên
Phương pháp mới này cho kết quả phù hợp
IV.4.2 So sánh hai giá trị trung bình từ hai dãy thí nghiệm song song
Khi cần đánh giá một phương pháp phân tích mới nhưng không có mẫu chuẩn a, ta cần phân tích đối tượng bằng một phương pháp đã được nghiên cứu kĩ Ví dụ, phương pháp
đã nghiên cứu cho kết quả X1 còn phương pháp mới cho kết quả X2
Tương tự như vậy người ta đánh giá chất lượng của hai phòng thí nghiệm hoặc hai người phân tích cùng dùng một phương pháp phân tích và cùng một mẫu phân tích
Ví dụ: PTN(A) cho kết quả XA1, XA2,…, XAn (sau n lần đo)
PTN(B) cho kết quả XB1, XB2,…, XBm (sau m lần đo) Đối với PTN(A) có: X1; S1; k1 = n – 1; Đối với PTN(B) có: X2; S2; k2 = m – 1
Việc so sánh X1 X2 được tiến hành như sau:
- Tính phương sai trung bình S2 =
2 2
1 1 2 2
1 2
k S +k S
k +k
- Tính X 1 1
S = S
nm
- Tính tT N = 1 2
X
S
So sánh với tLT = t(p,k=k1+k2)
+ Nếu tT N < tLT thì X1 X2 là do nguyên nhân ngẫu nhiên, các phép đo là như nhau + Nếu tT N>tLT thì X1 X2 không phải do nguyên nhân ngẫu nhiên
Ví dụ 1: Hàm lượng %N tìm thấy trong các mẫu phân tích bởi hai nhóm sản xuất cho
kết quả sau: X1 = 9,36 với S1 = 0,090 và X2 = 9,57 với S2 = 0,034; n1 = n2 = 4 Hãy so sánh hai kết quả trung bình
Áp dụng chuẩn t, ta có:
Trang 9+ S2 =
2 2
1 1 1 2
1 2
k S +k S
k +k = 4,63.10
-3
+ tT N = |9,36 – 9,57|/ -3
4
1 1 4,63.10 ( )
4 = 4,37 > tLT = t(0,99;6) = 3,71
Vậy hai giá trị trung bình sai khác nhau rất đáng kể (không đồng nhất)
Ví dụ 2: Để xác định nồng độ của dung dịch HCl người ta sử dụng hai chất gốc Na2CO3
và Borax Na2B4O7.10H2O Kết quả xác định nồng độ HCl theo hai chất gốc như sau:
- Theo Na2CO3: 0,1251; 0,1248; 0,1252; 0,1254 (C, mol/l)
- Theo Borax: 0,1254; 0,1258; 0,1253; 0,1255 (C, mol/l)
Hãy so sánh kết quả thu được và tính nồng độ của dung dịch HCl
Ta có: tT N = 2,38 < tLT = 2,447 X1 X2 do nguyên nhân ngẫu nhiên
Nồng độ HCl = X = 1 2
2
(X +X )
= 0,1253M
Trang 10CHƯƠNG V: PHÂN TÍCH HỒI QUY V.1 Phương trình hồi quy tuyến tính đơn giản (Y = a + bX)
Để tìm a, b của phương trình hồi quy tuyến tính y = a + bX ta dựa vào giá trị Xi trong thực nghiệm yi trong tính toán Giữa yi và Yi có độ sai lệch Tổng bình phương của độ lệch SSE = n 2
i i i=1
(y -Y )
sẽ càng nhỏ khi lựa chọn các hệ số a và b càng phù hợp Việc chọn a,
b thế nào cho SSE là cực tiểu gọi là phương pháp bình phương tối thiểu (Least Squares
Estimation – LSE)
V.2 Tính các hệ số và các thông số cần thiết:
- Tính yi = a + bXi Hiệu số (yi – Yi) = (a + bXi – Yi) với i = 1,n
- Lập hàm số SSE =
n
2
i i i=1
(y -Y )
i i i=1
(aX + b - Y )
- Hàm số SSE đạt min khi:
n
i i i
i = 1 n
i i
i = 1
X
SSE
0 2 (a + bX - Y ).X = 0 a
SSE 2 (a + b - Y ) = 0
0 b
- Giải hệ ta có:
n n n
i i i i
i = 1 i = 1 i = 1
2
n n 2
i i
i = 1 i = 1
b =
a = Y bX
n
i i
i = 1
n 2 2 i
i = 1
X Y nX Y
b =
X nX
a = Y bX
Lập kho dữ liệu:
X
n 2 i i=1
X
n
i i i=1
X Y
Các kí hiệu:
SST: Tổng bình phương của các sai số trong phân tích hồi quy
SST = 2
i 2
i
n
SSE: Tổng bình phương do sai số
SSE =
n
2
i i i=1
(y -Y )
i i i=1
(a + bX - Y )
=Y - a.i2 Yi - b. Xi Yi
SSR: Tổng bình phương do hồi quy
SSR = SST – SSE
MSR = SSR
MSE: Trung bình bình phương của sai số
MSE = SSE
n 2 (với yi = a + bXi có 2 ẩn)
Hệ số tương quan mẫu R:
R 2 = SSR
SST
- Tính khoảng tin cậy của a và b: a, b
Vì i = t(p,k).Si nên ta cần tính 2 2
a b
S ; S :