SỬ DỤNG THỐNG KÊ TRONG PHÂN TÍCH SỐ LIỆU
3. SAI SỐ TRONG PHÂN TÍCH
Với một mẫu cú giỏ trị thực là M, vỡ cỏc nguyờn nhõn khỏc nhau ta khụng thể xỏc ủịnh ủỳng giỏ trị M ủú mà chỉ xỏc ủịnh ủược giỏ trị trung bỡnh giữa cỏc lần ủo lặp lại. Thuật ngữ sai số ủược dựng ủể diễn tả mức ủộ sai lệch của phộp ủo, nú thể hiện ủộ lệch giữa cỏc giỏ trị thực nghiệm xi với nhau, với giỏ trị trung bình và với giá trị thực của mẫu. Trong phân tích ta chỉ cố gắng thực hiện sao cho sai số là nhỏ nhất, cỏc giỏ trị thu ủược từ thực nghiệm nằm trong khoảng chấp nhận chứ khụng thể loại trừ ủược hoàn
2 2,92 4,30 6,96 9,92
3 2,35 3,18 4,54 5,84
4 2,13 2,78 3,75 4,60
5 2,02 2,57 3,36 4,03
6 1,94 2,45 3,14 3,71
7 1,89 2,36 3,00 3,50
8 1,86 2,31 2,90 3,36
9 1,83 2,26 2,82 3,25
10 1,81 2,23 2,76 3,17
12 1,78 2,18 2,68 3,05
14 1,76 2,14 2,62 2,98
16 1,75 2,12 2,58 2,92
18 1,73 2,10 2,55 2,88
20 1,72 2,09 2,53 2,85
30 1,70 2,04 2,46 2,75
50 1,68 2,01 2,40 2,68
∞ 1,64 1,96 2,33 2,58
(3.7)
toàn sai số.
Khi trỡnh bày về kết quả bằng số liệu, cỏc tài liệu cú thể ủề cập ủến 2 loại là sai số tuyệt ủối và sai số tương ủối.
3.1. Sai số tuyệt ủối εεεε
Với M là giỏ trị thực của mẫu thử cần xỏc ủịnh, xi là giỏ trị ủo ủược từ thực nghiệm:
Giỏ trị Xtb thường khỏc với giỏ trị thực M của mẫu ủo. Khi n → ∞ thỡ Xtb → M.
Sai số tuyệt ủối là hiệu giữa giỏ trị trung bỡnh Xtb và giỏ trị thực M. Thụng thường khụng thể xỏc ủịnh ủược giỏ trị thực mà chỉ chấp nhận giỏ trị ủỏng tin cậy nhất trong dóy số liệu ủú là Xtb hay một cỏch gần ủỳng là hiệu của giỏ trị ủo ủược và Xtb.
M: giỏ trị thực của mẫu ủo ε : sai số tuyệt ủối
Sai số tuyệt ủối cú thể là số õm cũng cú thể là số dương.
3.2. Sai số tương ủối S
Sai số tương ủối S là tỉ số giữa sai số tuyệt ủối ε và giỏ trị thực M hoặc giỏ trị trung bỡnh Xtb. Thụng thường sai số tương ủối ủược biểu thị dưới dạng phần trăm.
Thí dụ: hàm lượng thực của Paracetamol trong viên nén là 500,2 mg; Codein là 30 mg. Sau khi tiến hành xỏc ủịnh theo phương phỏp sắc ký lỏng hiệu năng cao cho thấy hàm lượng Paracetamol là 500,9 mg và Codein là 30,7 mg.
• Sai số tuyệt ủối khi xỏc ủịnh hai hoạt chất trờn là như nhau: + 0,7 mg.
Sai số tương ủối thỡ khỏc nhau:
Như vậy sai số tương ủối thể hiện rừ hơn ủộ ủỳng của phương phỏp, với thớ dụ trờn cho thấy phương phỏp này xỏc ủịnh hàm lượng Paracetamol ủỳng hơn hàm lượng của Codein phosphat.
Khi trỡnh bày về nguyờn nhõn dẫn ủến cỏc kết quả thu ủược trong quỏ trỡnh thực nghiệm bị lệch nhau. Cỏc tài liệu thường ủề cập ủến 3 loại sai số: sai số ngẫu nhiờn, sai số hệ thống, sai số thụ.
3.3. Sai số ngẫu nhiên (random error)
Sai số ngẫu nhiờn hay cũn gọi là sai số khụng xỏc ủịnh là sai số gõy nờn bởi những nguyờn nhõn khụng xỏc ủịnh ủược, khụng biết trước, khụng cố ủịnh, thay ủổi khụng theo quy luật nờn khụng thể hiệu chỉnh hay loại trừ mà chỉ có thể hạn chế bằng cách tăng số lần phân tích và thao tác một cách cẩn thận, ủồng thời ủỏnh giỏ cỏc số liệu thực nghiệm bằng toỏn học thống kờ.
Cụng thức tớnh sai số tuyệt ủối: ε = Xtb - M hay ε = xi - Xtb (3.8)
(3.9)
3.4. Sai số hệ thống (systematic error)
Sai số hệ thống hay cũn gọi là sai số xỏc ủịnh là sai số biết rừ nguyờn nhõn và cú thể hiệu chỉnh ủược. Sai số này thường do cỏc nguyờn nhõn sau:
- Sai số do mẫu ủo: gõy ra khi mẫu phõn tớch khụng ủại diện. Việc lấy mẫu là tập hợp cỏc thao tỏc nhằm lấy một lượng mẫu ủại diện ủủ ủể tiến hành phõn tớch, ủồng thời việc lấy mẫu cần tuõn theo cỏc thủ tục quy ủịnh.
- Sai số do dụng cụ: dự ớt hay nhiều thỡ tất cả cỏc dụng cụ ủo lường luụn cú sai số hệ thống. Sai số này là do quá trình chế tạo và chuẩn hoá dụng cụ v.v…
Thớ dụ: - Cỏc dụng cụ ủo lường thụng thường như pipet chớnh xỏc, buret, bỡnh ủịnh mức là cỏc dụng cụ dựng ủể lấy thể tớch chớnh xỏc nhưng do trong quỏ trỡnh chế tạo hoặc sử dụng khụng ủỳng quy ủịnh có thể gây ra một sai số: thể tích của một buret 25 ml có sai số là ±0,03 ml có nghĩa là thể tích thật sự của buret là nằm trong khoảng [24,97 – 25,03] ml; bỡnh ủịnh mức cú thể tớch là 100ml nhưng nếu thực tế chỉ có 99,90 ml thì sai số là 99,90 – 100,00 = - 0,10 ml.
Sai số dụng cụ thường dễ phỏt hiện và hiệu chỉnh ủược bằng cỏch ủịnh kỳ chuẩn hoỏ cỏc dụng cụ trong phòng thí nghiệm.
- Sai số do phương phỏp ủo: phương phỏp ủo lường cũng gõy ra sai số hệ thống. Vỡ vậy, khi ỏp dụng một phương phỏp mới ủể phõn tớch luụn luụn phải xõy dựng và thẩm ủịnh quy trỡnh ủể chứng minh một cỏch khoa học rằng sai số của phương phỏp là rất thấp và cú thể chấp nhận ủược. Sai số do phương phỏp thường khú phỏt hiện và là nguyờn nhõn chớnh gõy ra sai số hệ thống. Thụng thường ủể phỏt hiện sai số phương pháp có thể tiến hành theo các cách sau:
- Thực hiện song song mẫu trắng ủể loại cỏc ủỏp ứng gõy ra do cỏc chất khụng cần phõn tớch.
- Phõn tớch mẫu chuẩn ủể kiểm tra ủộ ủỳng của phương phỏp.
- Phân tích cùng một mẫu nhưng bằng phương pháp dự kiến và thực hiện song song với ít nhất một phương pháp khác và so sánh hai kết quả.
- Sai số do người làm cụng tỏc phõn tớch: người làm cụng tỏc phõn tớch ủũi hỏi phải cú kỹ năng nghề nghiệp và kinh nghiệm phõn tớch. Sai số do từng cỏ nhõn là ủiều khụng trỏnh khỏi, mỗi cỏ nhõn cú một khả năng riờng về quan sỏt sự thay ủổi màu của dung dịch; quan sỏt ủiểm tương ủương trong chuẩn ủộ; ủọc vị trớ mực nước giữa hai vạch; ủọc tớn hiệu ủo ủược từ mỏy múc; hoặc do cẩu thả; do ủịnh kiến… ủều dẫn ủến sai số.
Sai số do cỏ nhõn cú thể khắc phục ủược khi thao tỏc ủỳng theo quy ủịnh và nhiều kiểm nghiệm viờn thực hiện trên cùng một mẫu thử.
XÁC ðỊNH SAI SỐ HỆ THỐNG
Bằng cỏch xỏc ủịnh mẫu chuẩn ủó biết hàm lượng, giỏ trị M coi như biết trước, Xtb thu ủược từ thực nghiệm. ðể so sỏnh sự khỏc biệt giữa giỏ trị M và Xtb (trong trường hợp thẩm ủịnh phương phỏp mới) thường sử dụng thống kê tính giá trị ttn rồi so sánh với tlt theo bảng (3.1) căn cứ vào bậc tự do (n − 1) và xác xuất P (95%).
Nếu ttn < tlt, kết luận không tìm thấy sai số hệ thống Nếu ttn > tlt, kết luận phương pháp có sai số hệ thống
Thí dụ: giả sử mẫu thử KMnO4 trong thí dụ 1 có hàm lượng thật M là 3,110 mg. Hãy xét xem phương pháp có sai số hệ thống không?
ttn = 0,3786 < tlt = 2,45 nên kết luận phương pháp không có sai số hệ thống (P = 95%).
Thớ dụ: trước khi phõn tớch ủể xỏc ủịnh hàm lượng của Na2CO3cú trong mẫu thử, một sinh viờn cú ý tưởng kiểm tra lại quy trình phân tích xem có sai số hệ thống hay không bằng cách phân tích một mẫu ủó biết hàm lượng M = 98,76%. Cỏc kết quả thu ủược sau 5 lần thực hiện:
98,71(%) 98,59(%) 98,62(%) 98,44(%) 98,58(%)
Như vậy tlt = 2,78 < ttn = 3,91, kết luận phương pháp có sai số hệ thống (P=95%).
3.5. Sai số thô (gross error)
Ngoài ra cũn cú sai số thụ là sai số khi kết quả giữa cỏc lần ủo lặp lại khỏc hẳn so với cỏc giỏ trị trung bỡnh hay giỏ trị thực của mẫu. Sai số thụ do nhiều nguyờn nhõn khỏc nhau: do ủọc kết quả ủo sai, lấy nhầm quả cân, v.v… ðể phát hiện và loại trừ sai số thô cần phải tiến hành phân tích nhiều lần trên một mẫu ủo (n > 6) và loại ủi những giỏ trị bất thường theo những quy tắc nhất ủịnh.
Loại trừ sai số thô
Thực tế sau khi tiến hành phõn tớch thường thu ủược một dóy cỏc số liệu, ủụi khi cú một vài số liệu cú giỏ trị khỏc hẳn: hoặc cao quỏ hoặc thấp quỏ, những số liệu này ủược gọi là sai số thụ hay số liệu xấu.
Cú hai cỏch ủể giỳp chỳng ta kiểm tra xem nờn giữ lại hay loại bỏ chỳng: dựng chuẩn Dixon và dựng bảng kiểm
ủịnh T.
3.5.1. Phương pháp dùng chuẩn Dixon (chuẩn Q) Sử dụng khi n < 10, gồm các bước như sau:
- Bước 1: sắp xếp cỏc số liệu theo thứ tự tăng dần hoặc giảm dần: x1, x2, x3,..., xn trong ủú x1 là số liệu nghi ngờ lớn nhất (max) hay nhỏ nhất (min), x2 là số liệu lân cận của số liệu nghi ngờ.
- Bước 3: so sỏnh giỏ trị Qtn với Qlt: Qlt > Qtn thỡ x1 ủược giữ lại Qlt < Qtn thì x1 bị loại bỏ
(3.10)
- Bước 2: dựng test Q ủể tớnh giỏ trị Qtn: (3.11)
Qlt ủược tra từ bảng (3.2) với số lần ủo n và xỏc suất bắt gặp P thụng thường là 95%.
Bng 3.2. Bảng kiểm ủịnh Q chuẩn DIXON
Thí dụ: ta có dãy số liệu sau 17,61 16,86 16,93 16,84 16,95 16,91
Bước 1: sắp xếp theo thứ tự 16,84 16,86 16,91 16,93 16,95 17,61; ta thấy số liệu nhỏ nhất là 16,84 (lõn cận là 16,86) và số liệu lớn nhất là 17,61 (lõn cận là 16,95) thường là hai số liệu ủỏng nghi ngờ.
Bước 2: tính giá trị Qtn ;
Bước 3: tra bảng (3.2) với n = 6; P = 0,95
Qlt (= 0,625) < Qtn (= 0,86) nên giá trị 17,61 bị loại bỏ Qlt (= 0,625) > Qtn (= 0,03) nờn giỏ trị 16,84 ủược giữ lại 3.5.2. Phương phỏp dựng bảng kiểm ủịnh T
Sử dụng với n bất kỳ. Sai số thụ thường rơi vào cỏc giỏ trị cực ủại hay cực tiểu của dóy số liệu, ta tính Ttn theo công thức sau:
Căn cứ vào số lần ủo n và vào xỏc suất ấn ủịnh trước P, tra Tlt theo bảng (3.3).
Tlt < Ttn thì số liệu nghi ngờ là sai số thô bị loại bỏ Tlt > Ttn thỡ số liệu nghi ngờ là sai số thụ ủược giữ lại
Bng 3.3. Giỏ trị t của bảng kiểm ủịnh T với P = 95%
n P
0,1 (90%) 0,05 (95%) 0,01 (99%)
3 0,941 0,970 0,994
4 0,765 0,829 0,926
5 0,642 0,710 0,821
6 0,560 0,625 0,740
7 0,507 0,568 0,680
8 0,468 0,526 0,634
9 0,437 0,498 0,598
10 0,412 0,466 0,568
(3.12) (3.13)
Thí dụ: với dãy số liệu 16,84 16,86 16,91 16,93 16,95 17,61 Với n = 6; Xtb = 17,02; SD = 0,292; P = 0,95 ta có Tlt = 1,996
Tlt (= 1,996) < Ttn (= 2,02) nên giá trị 17,61 bị loại bỏ.
Tlt (= 1,996) > Ttn (= 0,61) nờn giỏ trị 16,84 ủược giữ lại.