Khi phân tích hay xác định một mẫu thì người phân tích phải tiến hành một số phép thí nghiệm song song. Khi đó các kết quả riêng lẻ của phép xác định ngày càng gần nhau thì càng tốt và phải phù hợp với hàm lượng thực của mẫu ấy. Do đó có hai yêu cầu đối với người phân tích là: Căn cứ vào độ lặp của các kết quả thu được: Độ lặp lại (hay độ chính xác) phụ thuộc vào sai số ngẫu nhiên của phép phân tích. Nếu sai số ngẫu nhiên càng lớn thì độ tản mạn của các giá trị thu được khi lặp đi lặp lại phép phân tích sẽ càng lớn và độ chính xác của phép phân tích sẽ càng. Căn cứ vào sự phù hợp của kết quả đo với hàm lượng thực: Độ lệch khỏi hàm lượng thực của mẫu là do sai số hệ thống. Sai số ngẫu nhiên làm cho kết quả phân tích không chắc chắn, còn sai số hệ thống làm cho kết quả phân tích sai với giá trị thực. Vậy: Độ lặp lại (độ chính xác) và độ đúng của phương pháp phân tích cần được xem xét một cách kĩ càng, đặc biệt là phương pháp phân tích. Một phép phân tích phải có độ lặp và tính đúng đắn thoả mãn.
Thống kê xử lý số liệu thực nghiệm Hóa phân tích Hồ Sỹ Linh CHƢƠNG I: SAI SỐ TRONG ĐO ĐẠC THỰC NGHIỆM I.1 Mở đầu Khi phân tích hay xác định mẫu người phân tích phải tiến hành số phép thí nghiệm song song Khi kết riêng lẻ phép xác định ngày gần tốt phải phù hợp với hàm lượng thực mẫu Do có hai u cầu người phân tích là: - Căn vào độ lặp kết thu được: Độ lặp lại (hay độ xác) phụ thuộc vào sai số ngẫu nhiên phép phân tích Nếu sai số ngẫu nhiên lớn độ tản mạn giá trị thu lặp lặp lại phép phân tích lớn độ xác phép phân tích - Căn vào phù hợp kết đo với hàm lượng thực: Độ lệch khỏi hàm lượng thực mẫu sai số hệ thống Sai số ngẫu nhiên làm cho kết phân tích khơng chắn, sai số hệ thống làm cho kết phân tích sai với giá trị thực Vậy: Độ lặp lại (độ xác) độ phương pháp phân tích cần xem xét cách kĩ càng, đặc biệt phương pháp phân tích Một phép phân tích phải có độ lặp tính đắn thoả mãn I.2 Các phép đo I.2.1 Phép đo trực tiếp: Trong phép đo trực tiếp người ta so sánh mẫu cần đo với mẫu chuẩn Ví dụ, phép cân người ta so sánh mẫu cần đo với khối lượng cân Trong phép đo thể tích người ta so sánh dung tích mẫu cần đo với dung tích pipet, bình định mức… I.2.2 Phép đo gián tiếp: Trong phép đo gián tiếp, nhờ số liệu phép đo trực tiếp kết nhận cách tính tốn nhờ cơng thức xác định Ví dụ, phép xác định khối lượng riêng phép đo Nhờ kết phép đo trực tiếp khối lượng (m) phép đo trực tiếp thể tích (V), dùng cơng thức d = m/V ta tính khối lượng riêng (d) I.2.3 Phép đo tập hợp: Ngoài phép đo trực tiếp phép đo gián tiếp người ta dùng phép đo tập hợp Trong phép đo tập hợp, nhờ số liệu phép đo trực tiếp, lúc tính nhiều đại lượng cần đo I.3 Sai số đo đạc thực nghiệm I.3.1 Độ lặp (độ xác) độ phép phân tích: Trong phép phân tích muốn cho phép đo hữu hạn mà giá trị thực nghiệm thu X1X2 …Xn phải có độ lặp tốt Vậy độ lặp phép đo phản ánh phân tán giá trị thực nghiệm xung quanh giá trị trung bình Mặt khác ta mong muốn đại lượng trung bình cộng X gần với giá trị thực ( X ) Độ phép phân tích phản ánh mức độ phù hợp đại lượng X với giá trị thực Một phép đo xác không hay ngược lại Một phép đo tốt cần có độ xác cao độ tốt Sai số ngẫu nhiên ảnh hưởng đến độ xác phép đo, sai số hệ thống ảnh hưởng đến độ phép đo * Phân biệt độ độ xác: - Một phép đo có độ cao x gần Khoa Hoá học – ĐH Đồng Tháp Thống kê xử lý số liệu thực nghiệm Hóa phân tích - Hồ Sỹ Linh Một phép đo có độ xác cao số lần đo lặp lại cao Tuy nhiên khơng phải độ cao thiết có độ xác cao I.3.2 Sai số ngẫu nhiên sai số hệ thống a) Sai số ngẫu nhiên: Sai số ngẫu nhiên phát sinh hàng loạt ngẫu nhiên khơng kiểm sốt ln ln có mặt phép đo b) Sai số hệ thống: Sai số hệ thống nguyên nhân xác định gây tăng giảm theo chiều cố định không thay đổi Sai số hệ thống làm cho giá trị thực nghiệm không phù hợp với giá trị thực I.3.3 Sai số tuyệt đối sai số tƣơng đối: a) Sai số tuyệt đối: Là hiệu giá trị trung bình giá trị thực giá trị đáng tin cậy nhất: a = X – Tuỳ theo X lớn hay bé mà ta có sai số dương hay âm b) Sai số tương đối: Là tỉ số sai số tuyệt đối a giá trị thực giá trị trung bình q= a 100% = X μ 100% X X c) Sai số thô: Là sai số lớn làm thực nghiệm đọc sai cân, tính tốn nhầm đơn vị, lấy nhầm thể tích… I.4 Số có nghĩa cách ghi kết số liệu phân tích.* I.4.1 Chữ số có nghĩa (CSCN): Kết phép đo trực tiếp thao tác phân tích phải ghi chép cho người sử dụng số liệu hiểu độ xác phép đo Các số liệu ghi chép theo nguyên tắc: “Số liệu phải ghi cho có số cuối bất định” a) Ðể phản ánh mức độ tin cậy số đo thực nghiệm, ta phép ghi số đo chữ số có nghĩa (CSCN) b) Ðối với số đo số đo thông thường, ta phân biệt hai loại chữ số có nghĩa sau: - Chữ số có nghĩa khơng tin cậy: chữ số đứng sau bên phải số đo Chỉ có CSCN không tin cậy số đo - Chữ số có nghĩa tin cậy: tất chữ số đứng trước CSCN không tin cậy tận bên trái chữ số khác chữ số - Khi ghi số đo thực nghiệm, cần lưu ý đến vai trò chữ số Số dùng để thiết lập số thập phân khơng phải số có nghĩa Thí dụ: 12,04 ml: có CSCN ; 10,05 ml: có CSCN 0,28 ml : có CSCN ; 5,40 ml : có CSCN - Một số đo có hay nhiều CSCN tin cậy Càng nhiều chữ số có nghĩa phép đo xác Thí dụ: Ðọc buret, ta ghi số đo 12,65 ml Số có tất CSCN, phân loại sau: số CSCN không tin cậy; 1, 2, chữ số có nghĩa tin cậy Các chữ số 1, 2, CSCN tin cậy buret có chia độ xác đến 0,1 ml đọc thấy rõ chữ số Chữ số thuộc loại CSCN khơng tin cậy nhiều người đọc phải ước lượng mắt có chênh lệch, có đọc thành 12,64 ml 12,66 ml Khoa Hoá học – ĐH Đồng Tháp Thống kê xử lý số liệu thực nghiệm Hóa phân tích Hồ Sỹ Linh Vì khơng viết 2,4g (2CSCN) = 2400mg (4 CSCN) mà phải viết 2,4g = 2,4.10 mg Hoặc không viết 7,3.10 (2 CSCN) = 7300 (4 CSCN)… c) Xác định CSCN thang đo số I.4.2 Quy tắc làm tròn số cho số đo gián tiếp: Số đo gián tiếp số đo tính từ số đo trực tiếp thơng qua biểu thức tốn học Sai số số đo trực tiếp lan truyền sang số đo gián tiếp nên ta phải ghi số đo gián tiếp chữ số có nghĩa Khi tính tốn thường có nhiều số lẻ, cần phải làm tròn số Trong phép tính làm tròn kết cuối Chúng ta làm tròn số theo số quy tắc sau: a) Đối với phép cộng trừ: Chỉ giữ lại kết cuối số chữ số thập phân số chữ số thập phân số hạng có số chữ số thập phân Thí dụ 1: 6,145 + 13,24 + 34,7 = 54,085 54,1 Thí dụ 2: Hãy tính phân tử lượng BaO Biết Ba = 137,34; O = 15,9994 BaO = 137,34 + 15,9994 = 153,3394 = 15,34 b) Đối với phép nhân; chia: Chỉ giữ lại kết cuối số chữ số có nghĩa thừa số có số chữ số có nghĩa Thí dụ 1: 6,125.10 -5x 3,7.10 -8x 5,37 = 1,21697625.10 -11 1,2.10 -11 Thí dụ 2: Chuẩn độ 10,00ml dung dịch HCl dung dịch NaOH, 0,09215 M Thể tích NaOH tiêu tốn 2,45 ml Tính CHCl 0,09215 x 2,45 CHCl = = 0,0225767 0,0226 M (Số CSCNmin = 3) 10,00 Khoa Hoá học – ĐH Đồng Tháp Thống kê xử lý số liệu thực nghiệm Hóa phân tích Hồ Sỹ Linh CHƢƠNG II: NHỮNG ĐẶC TRƢNG THỐNG KÊ CỦA ĐẠI LƢỢNG NGẪU NHIÊN II.1 Các đại lƣợng trung bình (Mean): II.1.1 Trung bình cộng: Giả sử sau n lần xác định ta giá trị X1, X2, …, Xn Giá trị trung bình cộng tính theo cơng thức: X= n X gọi kì vọng mẫu n i=1 i II.1.2 Trung vị (Median): Khi giá trị thực nghiệm xếp theo thứ tự tăng dần X1 tLT = t(0,99;6) = 3,71 4 Vậy hai giá trị trung bình sai khác đáng kể (khơng đồng nhất) Ví dụ 2: Để xác định nồng độ dung dịch HCl người ta sử dụng hai chất gốc Na2CO3 Borax Na2B4O7 10H2O Kết xác định nồng độ HCl theo hai chất gốc sau: - Theo Na2CO3: 0,1251; 0,1248; 0,1252; 0,1254 (C, mol/l) - Theo Borax: 0,1254; 0,1258; 0,1253; 0,1255 (C, mol/l) Hãy so sánh kết thu tính nồng độ dung dịch HCl Ta có: tT N = 2,38 < tLT = 2,447 X1 X2 nguyên nhân ngẫu nhiên + tT N = |9,36 – 9,57|/ Nồng độ HCl = X = (X1 +X ) Khoa Hoá học – ĐH Đồng Tháp = 0,1253M Thống kê xử lý số liệu thực nghiệm Hóa phân tích Hồ Sỹ Linh CHƢƠNG V: PHÂN TÍCH HỒI QUY V.1 Phƣơng trình hồi quy tuyến tính đơn giản (Y = a + bX) Để tìm a, b phương trình hồi quy tuyến tính y = a + bX ta dựa vào giá trị Xi thực nghiệm yi tính tốn Giữa yi Yi có độ sai lệch Tổng bình phương độ lệch SSE = n (y -Y ) i i nhỏ lựa chọn hệ số a b phù hợp Việc chọn a, i=1 b cho SSE cực tiểu gọi phương pháp bình phương tối thiểu (Least Squares Estimation – LSE) V.2 Tính hệ số thơng số cần thiết: - Tính yi = a + bXi Hiệu số (yi – Yi) = (a + bXi – Yi) với i = 1,n - n n i=1 i=1 (yi -Yi )2 = (aXi + b - Yi )2 Lập hàm số SSE = - SSE 2 n (a + bX - Y ).X = i i i Hàm số SSE đạt khi: a i =n SSE 2 (a + bXi - Yi ) = i=1 b - n n n X n Y n X Y i i Xi Yi nX.Y i i i=1 i=1 i=1 i = b = b = n n n Giải hệ ta có: hay Xi nX n Xi Xi i=1 i=1 i=1 a = Y bX a = Y bX Lập kho liệu: n n Xi2 X Y i=1 … X Y i i i=1 … … … Các kí hiệu: SST: Tổng bình phƣơng sai số phân tích hồi quy SST = Y i Y i n SSE: Tổng bình phƣơng sai số n SSE = (y -Y ) i i i=1 = (a + bXi - Yi )2 = Yi2 - a. Yi - b. Xi Yi n i=1 SSR: Tổng bình phƣơng hồi quy SSR = SST – SSE MSR = SSR MSE: Trung bình bình phƣơng sai số SSE MSE = (với yi = a + bXi có ẩn) n2 Hệ số tƣơng quan mẫu R: SSR R2 = SST - Tính khoảng tin cậy a b: a, b Vì i = t(p,k).Si nên ta cần tính Sa2 ; Sb2 : Khoa Hoá học – ĐH Đồng Tháp 10 Thống kê xử lý số liệu thực nghiệm Hóa phân tích Hồ Sỹ Linh n S2Y Xi2 S2Y SSE 2 i=1 Ta có: S = MSE = (vì ẩn); Sa = n ; Sb = n 2 n2 n ( Xi2 nX ) Xi nX Y i=1 i=1 Ví dụ: Người ta xác định Fe(II) axit thioglycolic dùng phương pháp đo quang Thực nghiệm nhận giá trị sau: Xi – Hàm lượng Fe(II) (mg/l) 10 20 30 40 50 Yi – mật độ quang A 0,009 0,035 0,061 0,083 0,109 0,133 Lập kho liệu: Gọi phương trình hồi quy y = aX + b STT Xi Yi X i2 Xi Yi 0 10 100 20 400 30 900 40 1600 50 2500 Tổng: 150 5500 Ta có: X = 150/6 = 25; Y = 0,430/6 0,009 0,035 0,061 0,083 0,109 0,133 0,430 0,35 1,22 2,49 4,36 6,65 15,07 n Xi Yi nX.Y 15, 07 25.0, 430 i=1 = 2, 468.103 b = n 2 5500 6.25 Xi nX i=1 a = Y bX = Y bX 0, 430 2, 468.103 0,010 y = 0,010 + 2,468.10 -3X (*) Để tính giới hạn tin cậy a, b ta lập kho liệu sau: yi tính theo (*) Xi Yi 10 20 30 40 50 Tổng 0,009 0,035 0,061 0,083 0,109 0,133 0,0100 0,0347 0,0574 0,0841 0,1088 0,1335 (Yi – yi ).10 (Yi – yi ).10 -1,00 0,30 1,60 1,10 0,20 0,50 1,00 0,09 2,56 1,21 0,04 0,25 5,15 SSE 5,15.10-6 SSE = (yi -Yi ) = 5,15.10 S = = =1,29.10 -6 62 n2 i=1 n -6 2 Y n S2Y Xi2 Ta có: Sa2 = i=1 n n ( Xi2 nX ) = 1,29.10-6 5500 = 6,76.10 -7 Sa = 8,2.10 -4 a = 2.10 -3 6(5500 6.25 ) i=1 S2b = Y S n 2 Xi nX = 1,29.10-6 = 7,37.10 -10 Sb = 2,7.10 -5 b = 7.10 -5 5500 6.252 i=1 Vậy ta có phương trình hồi quy đầy đủ: y = (0,010 0,002) + (0,00247 0,00007)X V.3 Xét ý nghĩa hệ số hồi quy theo chuẩn Student: Đặt giả thiết thống kê; Khoa Hoá học – ĐH Đồng Tháp 11 Thống kê xử lý số liệu thực nghiệm Hóa phân tích Hồ Sỹ Linh Ho: Hệ số hồi quy khơng có ý nghĩa H1: Hệ số hồi quy có ý nghĩa Giá trị thống kê: a b + Tính tT N: tT N(a) = ; tT N(b) = Sa S2b + So sánh tT N với tLT = t(p,k) với k = n – 2: Nếu tT N < tLT Chấp nhận giả thiết Ho, hệ số khơng có ý nghĩa Nếu tT N > tLT Bác bỏ giả thiết Ho, hệ số có ý nghĩa Nếu đường thẳng y = a + bX tính số a ta thu giá trị bé (hệ số a khơng có ý nghĩa) nghi ngờ phương trình có dạng: y = bX Điều SSE ln ln xảy trường hợp hai đại lượng phương sai S2 = (đối n2 SSE' với phương trình y = a + bX, có ẩn) S’2 = (đối với phương trình y = bX, có ẩn) n 1 khác cách ngẫu nhiên Để kiểm tra người ta dùng chuẩn Fisher với: FT N = (SSE’ – SSE)/S2 So sánh FT N với FLT = F(p,k1=1; k2= n–2) k1= m – = (vì có phương sai) Nếu FT N < FLT Việc chuyển sang phương trình y = aX có sở Ví dụ: Để xác định vết COS khơng khí người ta đo mật độ quang vùng IR Trong khoảng nồng độ 0,003 – 0,05% COS, nồng độ mật độ quang có quan hệ xác định phương trình y = 115,567x + 0,001 Do số hạng b bé nên cần kiểm tra xem quy phương trình y = 119,625x khơng? Ta có thơng số sau: Hàm SSE n k S2 y = 115,567x + 0,001 0,4107 19 17 0,0242 y = 119,625x 0,4682 19 18 0,0260 Ta có: FT N=(0,4682–0,4107)/0,0242 = 2,38 FLT Bác bỏ giả thiết Ho, phương trình hồi quy thích hợp - Ta đánh giá mức độ tương quan X Y dựa vào hệ số tương quan R: SSR R2 = (Vì SSR = SST – SSE) -1 R SST V.2.5 Trình bày phƣơng trình hồi quy kèm theo đặc trƣng cần thiết: Phương trình Y = (a a) + (b b)X (với p = 0,95); Hệ số tương quan R2 = (X, Y tương quan tốt , trung bình, kém…) Khoa Hố học – ĐH Đồng Tháp 12 ... chép theo nguyên tắc: Số liệu phải ghi cho có số cuối bất định” a) Ðể phản ánh mức độ tin cậy số đo thực nghiệm, ta phép ghi số đo chữ số có nghĩa (CSCN) b) Ðối với số đo số đo thông thường, ta... mà ta có sai số dương hay âm b) Sai số tương đối: Là tỉ số sai số tuyệt đối a giá trị thực giá trị trung bình q= a 100% = X μ 100% X X c) Sai số thô: Là sai số lớn làm thực nghiệm đọc sai...Thống kê xử lý số liệu thực nghiệm Hóa phân tích - Hồ Sỹ Linh Một phép đo có độ xác cao số lần đo lặp lại cao Tuy nhiên khơng phải độ cao thiết có độ xác cao I.3.2 Sai số ngẫu nhiên sai số hệ thống