Chương II XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS MỤC ĐÍCH Khi tiến hành các thí nghiệm ta thu được nhiều số liệu.
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HỐ SỐ LIỆU STATISTICS FOR CHEMISTS MỤC ĐÍCH: Khi tiến hành thí nghiệm ta thu nhiều số liệu gọi tập số liệu thực nghiệm (SLTN) (Data set) Các vấn đề đặt KQTN là: Độ tin cậy giá trị nào? (sai số, % ) Yếu tố ảnh hưởng đến KQTN như: pH; C; t0;… ảnh hưởng đến hiệu suất phản ứng? Có thể biểu diễn ảnh hưởng phương trình tốn học khơng (mơ hình hố thí nghiệm)? Điều kiện tối ưu để thu KQTN tốt (tối ưu hố thí nghiệm – Experimental Optimization)? Tất câu hỏi đề giải phương pháp thống kê Chương I MỘT SỐ KHÁI NIỆM CƠ BẢN KQTN sai số kèm đại lượng ngẫu nhiên (nhận giá trị khoảng xác định) Mỗi đại lượng ngẫu nhiên (ĐLNN) có hai đặc trưng “Tâm” (giá trị trung bình) độ phân tán kết Vậy, đại lượng mơ tả tâm / độ phân tán gì? I.1 Giá trị trung bình: Mơ tả “tâm” ĐLNN/ tập SLTN Trung bình số học (Mean): Đây đại lượng thường dùng thống kê Ta tiến hành n thí nghiệm thu kết quả: x1, x2,…, xn Thì trung bình số học tính theo cơng thức: n x i x i 1 n hay x x i n Tính chất: Tổng độ lệch 0: xi x 0 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Trung bình bình phương: xbp x i n x Trung bình nhân: xnh n xi lg xnh lg xi xnh x n Trung vị / số (Median): giá trị đứng gữa n n 1 Nếu n chẵn thì: Trung vị = Nếu n lẻ thì: Trung vị = số (sắp xếp cấcgí trị từ thấp đến cao) Lưu ý: Arerage: Mô tả chung cho giá trị mà khơng nói rõ giá trị I.2 Các đại lượng đặc trưng cho độ phân tán ĐLNN hay tập SLTN Khoảng biến động/ khoảng dao động (Range): R = xmax - xmin Phương sai (Variance): Được ký hiệu là: S2 2 xi x n x hay i x ; với n số thí nghiệm n > 30 n S x i x i n ; với n số thí nghiệm n < 30 n Phương sai đại lượng mô tả lặp lại phân tán số liệu thực nghiệm Với n – bậc tự (Freedom degree) (nếu biết n -1 độ lệch ta tìm độ lệch cịn lại; bậc tự n -1 với ý nghĩa có n -1 số liệu tự số liệu lại chịu ràng buộc để tổng độ lệch không ( xi x 0 )) (Phương sai khó hình dung có thứ ngun bình phương) Tính chất phương sai: ( S , D ) D(c) = với c = const; D(cx) = C2D(x) với x biến số; D(c+x) = D(c) + D(x) = D(x); D(xy) = D(x) D(y) với x,y biến số; XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Hệ quả: KQTN thường mắc sai số nhiều nguyên nhân khác như: - Bản thân phương pháp đo: S12 - Kỹ thuật lấy mẫu (mẫu có đại diện khơng?) S 22 - Thời gian lấy mẫu, không gian,……….: S 32 ,… Như sai số tổng cộng tổng sai số: S S i2 Nếu giá trị đo cho hàm số y = f(x1, x2,…, xi, , xn) S y2 S i2 Độ lệch chuẩn (SD: Standard Deviatim): Ký hiệu (nếu n > 30) S (nếu n < 30) ; S S x x i n x i x i n n , S mô tả tốt độ lặp lại / độ phân tán KQTN (ĐLNN) có thứ ngun trùng với thứ nguyên đại lượng đo (Đo – Measurement; Phân tích – Analysis; Tính,….) Thí dụ: [PbII] = (1,0 0,5))g/l (1ppb = g/l) ( ppm: Parst Per Million: phần triệu (10 -6) (ppb: Parst Per Billion : phần tỷ(10 -9) (ppt: Parst Per trillion : phần nghìn tỷ(10 -12) Vd: 0,033% = 330 ppm Độ lệch chuẩn tương đối (RSD: Relative Standard Deriation; CV: Coefficient of Variation) 100.S RSD(%) CV (%) x Chú ý: + , S2, S, RSD, CV mô tả sai số đại lượng đo mô tả sai số ngẫu nhiên + Trong phân tích đo lường, xác định giá trị nhỏ sai số (RSD) lớn Vấn đề đặt xác định nồng độ RSD chấp nhận (Trace Analysis: phân tích vết C ppm; Ultra Trace Analysis: phân tích siêu vết C ppb) Để trả lời câu hỏi trên, người ta thấy C RSD có mối quan hệ theo hàm Horwitz XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS RSD 2 (1 0,5) lg C ) Khi C = 1ppb = 10-9 RSD = 25),5) = 45),25) (%) – RSDHorwitz kết phịngthí nghiệm giới Trong nội phịng thí nghiệm RSD = ½ RSDHorwitz chấp nhận +RSD % %0 ppm ppb … C nhỏ dần -RSD RSDHorwitz xác định hệ thống kiểm tra nội nghiệm – Collaborative Testing (phân tích mẫu phương pháp) Hệ thống kiểm tra liên phịng thí nghiệm – Interlaborative Testing (phân tích nhiều phương pháp khác mẫu) RSD gần với RSDHorwitz I.3 Sai số (Erorr): Là độ lệch đại lượng đo giá trị thực nó: Sai số = x - Trong thực tế thường ta giá trị thực đại lượng đo Do vậy, để mô tả sai số người ta dùng S, RSD, CV, (biên giới tin cậy), U (Uncertrainty: độ bất ổn định / độ không đảm bảo đo/ độ không chắn/ độ không xác định / sai số mở rộng đại lượng đo) Để xác định giá trị thực đại lượng đo, theo quy định quốc tế ta phải phân tích mẫu chuẩn hay mẫu vật liệu so sánh cấp chứng (mẫu CRMs: Certified Refference Materials) (Mẫu CRMs số hãng giới sản suất) Độ đúng/ độ xác/ mức xác – Accuracy: Độ = x Chỉ xác định độ phân tích mẫu chuẩn CRMs Các loại sai số: (1) Sai số ngẫu nhiên (SSNN) – Random Erorr/ Indeterminate Erorr): sai số ln bắt gặp cácthí nghiệm; âm dương Thông thường, để giảm SSNN người ta thường tăng số thí nghiêm lên XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS (2) Sai số hệ thống (SSHT) – Systematic Erorr/ Determinate Erorr: sai số nằm phía giá trị thực (hay giá trị trung bình x ); âm dương Nguyên nhân: - Do hố chất bẩn - Do thiết bị khơng xác - Do thân phương pháp - D kỹ theo tác … Để giảm SSHT cần kiểm soát nguyên nhân (3) Sai số thô – Outlier Chú ý: + S, RSD, CV, mô tả sai số ngẫu nhiên (hay độ lặp lại/ độ phân tán) KQTN U (sai số tổng cộng): bao hàm SSNN SSHT Trong thực tế người ta thường biểu diễn KQTN dạng: x S (n=?) x RSD (n=?) + S, U, : biểu diễn sai số tuyệt đối (chúng có thứ nguyên với đại lượng đo); RSD, CV: biểu diễn sai số tương đối (thứ nguyên %) Thí dụ: [CuII] = (0,10,2)ppb [PbII] = (5,00,5)ppb So sánh xem phép xác định xác hơn? RSDCu II 0,2.100 0,5).100 20%; RSDPb II 10% 1,0 5),0 Như phép xác định PbII xác Mặc dù SCu(II) < SPb(II) + Độ lặp lại – Precision: có trường hợp: - Thí nghiệm điều kiện đồng (cùng thời gian, thiết bị, hoá chất, người làm) Độ lặp lại – Repeatability - Thí nghiệm điều kiện khơng đồng Độ thu hồi/ độ phục hồi – Reproducility (khác với độ thu hồi Recovery: thường dùng để đánh giá phép đo) Thí dụ: Khi đo mẫu PbII: Lần mẫu PbII [PbII]= 1,0 ppb ta đo 5) XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Lần mẫu PbII + 0,5ppb ta đo [PbII]= 1,3 ppb Độ thu hồi phép đo: 1,3 Re v 100 85)(%) 1,0 0,5) (Spike: thêm ít; Addition: thêm nhiều) Kết luận: Để đánh giá độ (accuracy), người ta tiến hành cách sau: + Phân tích mẫu chuẩn CRMs + Thêm chất phân tích vào mẫu (Spike) xác định độ thu hồi + Phân tích phương pháp chuẩn để so sánh kết đo với kết đo phương pháp chuẩn Cách lấy số có nghĩa: Trong Hố học, kết thí nghiệm thu ln mắc sai số Vì vậy, việc lấy giữ lại số có nghĩa quan trọng Con số có nghĩa số biểu diễn cho có số cuối sai, nghã số đứng trước số Để giữ lại số có nghĩa, phải dựa vào độ lệch chuẩn S hay RSD Nếu khơng có S, RSD ta dựa vào hàm Horwitz: RSD 2 (1 0,5) lg C ) hay S RSD.x (1 0,5) lg C ).x 100 100 Thí dụ 1: %TiO2 = 0,35)2 % 0,4 %; C = 4.10-3 RSD 2 (1 0,5) lg C ) 2 (1 0,5) lg( 4.10 S RSD.x 5).0,4 0,02 100 100 3 ) 2 2, 5)% (như ta lấy số sau dấy phảy) Thí dụ 2: y = 3,2 (ml) 2,25)2 (mg/ml) = 7,2064 (mg) Ta có sai số thể tích là: SV 0,1 3,2 30 Ta có sai số nồng độ là: SC 0,001 2,25)2 2000 Ta có sai số y là: Sy 0,0001 7,2064 70000 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Như sai số kết đo phải cho với sai số lớn số, nghĩa kết y = 7,2 hay nói cách khác sai số V định sai số phép đo Khi Sy = 1/72 Độ tin cậy phép đo đánh giá qua thông số sau: S (Signal) + Độ lặp lại: S, RSD/ CV + Độ nhạy (Sensitivity) Độ dốc đường chuẩn = S x S2 b2 Nếu hệ số góc b lớn độ nhạy cao ngược lại + Giới hạn phát (DL: Detection Limit): mô tả khả định tính phương pháp x2 b1 x1 S1 x DL nồng độ nhỏ chất phân tích mà ta phát cách tin cậy Thực tế ta nên xác định giới hạn định lượng (QL: Quantitation Limit) QL = ÷ DL I.4 Phân bố Phân bố thực nghiệm Thực thí nghiệm thu KQTN: x1, x2, …, xn Vấn đề đặt kết phân bố nào? Để xác định phân bố KQTN người ta tiến hành sau: Chia SLTN thành khoảng d tương đương nhau: d n Xác định tần xuất SLTN khoảng di xác định ni mi ; n ni: số lần xuất kết xi khoảng di Biểu diễn kết lên hệ toạ độ: ni = f(xi) XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU ni STATISTICS FOR CHEMISTS ni xi 5) … Phân bố thực nghiệm ni xi Phân bố lệch trái xi Phân bố lệch phải - Nếu xi gần với có tần xuất max - Phân bố KQTN thông thường đối xứng KQTN tốt; KQTN phân bố lệch Để trở đối xứng ta xây dựng ni = f(lgxi) Phân bố lý thuyết a Phân bố chuẩn/ phân bố Gauss – Normal Distribution / Gauss Distribution: Các SLTN sai số Hoá học tuân theo phân bố chuẩn Hàm phân bố chuẩn: 1 2 y e 2 Trong đó: x x: KQTN : Độ lệch chuẩn (n lớn) : Giá trị thực đại lượng đo 2 x y Dạng đồ thị: Nhận xét: Xác xuất P (Probality) thu nằm miền {- ÷ +} x - + Phân bố chuẩn P ydx 0,68 68% P(-2 < x < +2) = 95)% P(-3 < x < +3) = 99,7% P: gọi xác xuất tin cậy (Confidence Prob) = 68%; 95)%;… gọi độ tin cậy/ mức tin cậy (Confidence Level) XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Ở P hay cao sai số lớn Thông thường người ta hay chấp nhận = 95)%; P = 0,95) Người ta lấy biên giới 3 để phân biệt SSHT SSNN (ngoài miền SSHT không chấp nhận được; miền SSNN) Hàm y hàm xác xuất phụ thuộc vào hai biến ( p = f(,) Để lập bảng tra cứu người ta chuẩn hoá hàm Gauss: Đặt u x u D (u ) ( 2 u 0; u 1 y D ( x) D ( ) 1 ) 2 2 e y 2 u2 u Tiến hành lập bảng: Phân bố Gauss Biết u P; Biết P u Lưu ý: + Đại lượng u thực tế kiểm tra nội nghiệm kiểm tra liên nghiệm đại lượng gọi “Zscore” Z tốt (chất lượng phịng thí nghiệm tốt); cịn phịng thí nghiệm có Z > PTN có chất lượng tồi + Trong thực tế số phịng thí nghiệm tham gia phân tích > 30 (n > 30) nên phân bố chuẩn có ý nghĩa lý thuyết dùng đánh giá số liệu Khi biết giá trị riêng lẻ đại lượng đo (ĐLNN) ta tính độ lệch chuẩn x (ĐLNN) có x ? Khi đo mẫu: n =3 n =7 x2 n =10 x3 x1 …………… x x xn n 2 x2 ; x n n n Trong thực tế, biểu diễn KQTN người ta thường ghi kèm độ lệch chuẩn số thí nghiệm n XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Thí dụ: Điểm trung bình lớp với 5)0 HS 7,2 1,0 (n = 5)0) 72, 1,0 5)0 Từ phân bố chuẩn ta xác định biên giới tin cậy : u x x u x Khi biểu diễn KQTN người ta thường ghi xác xuất tin cậy Thí dụ: 1,0 0,3 ( P 0,95); n 3) Đối với giá trị trung bình: x u u ; ( x ; x ) n n n Thường thực tế người ta biểu diễn: x ( P; n) b Phân bố Student (phân bố t): Trong thực tế người ta thường tiến hành với số thí nghiệm n nhỏ nên khơng thể dùng phân bố chuẩn để đánh giá KQTN (vì sai lệch nhiều) Trong trường hợp này, người ta đề nghị dùng phân bố Student để đánh giá KQTN (bù lại sai lệch đánh giá qua phân bố chuẩn) Hàm phân bố t phức tạp chứa biến t (chuẩn t/ chuẩn Student) biến f (bậc tự do) (t ) f = 20 f = 10 t t = Dạng phân bố t tương tự phân bố chuẩn phụ thuộc vào f f lớn (n lớn) phân bố t tiến tới phân bố chuẩn Chuẩn t: t x Sx ; Sx x x S ; t S n tS n ; n tS n t = f(p,f = n-1) người ta lập bảng tra cứu Nếu P = const f tăng t giảm Nếu f = const P tăng t tăng Lưu ý: S t phải bậc từ Nếu số thí nghiệm n lớn t(P=0,95); f) = 1,96 khí S 2 n (F ) f , f t = 10 F XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Chấp nhận giả thiết H0 Đánh giá độ giả thiết H0 Tính (áp dụng thống kê xác suất) xác suất loại bỏ H 0/ bác bỏ H0 Xác suất gọi mức ý nghĩa P (%) (t) = f (t;f) từ t,f So sánh P với “chuẩn” để đánh giá giả thiết H0 Trong thực tế, người ta tính chuẩn thống kê (t, F, 2) từ số liệu thực nghiệm (SLTN) thu ta giá trị t tính, Ftính, 2tính,… sau tra bảng để xác định chuẩn thống kê mức ý nghĩa t(p; f); F(p; f1; f2; ); … sau so sánh giá trị chuẩn thống kê tính với chuẩn thống kê tra bảng đến nhận xét/ kết luận Nếu ttính < t(p;f) ta chấp nhận giả thiết H0 – hai đại lượng so sánh không khác / khơng khác có ý nghĩa mặt thống kê; hay nói cách khác mắc sai số ngẫu nhiên không mắc sai số hệ thống Ngược lại, ttính > t(p;f) ta bác bỏ giả thiết H0; chấp nhận giả thiết thay Ha (Alternative) Kết luận hai đại lượng đo khác hay mắc sai số hệ thống Chú ý: Trong thống kê, mà kết luận sai; có mà kết luận không ta gọi sai số loại Ngược lại, sai mà kết luận đúng, khơng mà kết luận có ta gọi sai số loại Trong nghiên cứu, người ta mong ss loại ss loại nhỏ; nhỏ đến mức tuỳ thuộc vào người nghiên cứu (thí dụ: Mỹ chấp nhận 7% p=0,07; châu Á, EU: 5% p=0,05) Nhiều báo cáo kết người ta ghi mức ý nghĩa p kèm Thí dụ: Xác suất Mẫu trắng Mẫu Biến x 1=0 20 ss loại ss loại STT KQ đo p x1 0,001 x2 0,09 15) XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Khi chấp nhận H0 tức khơng có sở để bác bỏ H chưa II.3 ÁP DỤNG: Trường hợp đo mẫu Bài tốn 1: So sánh x& Thí dụ: So sánh kết phân tích mẫu chuẩn CRMs () với giá trị thông báo chứng mẫu CRMs ( ) So sánh kết đo phương pháp ( x ) với kết đo phương pháp chuẩn ( ) Nghiên cứu ảnh hưởng yếu tố đến đại lượng đo (TD: mẫu chứa CuII; đo CuII thu ; mẫu chứa CuII PbII; đo CuII thu x So sánh PbII có ảnh hưởng đến phép đo Cu II khơng?) Giải: Tiến hành n thí nghiệm thu kết quả: x1; x2; ; xn từ tính x Tính S Tính x t tính i x n x S n Tra bảng xác định t(p=0,05); f=n-1) So sánh ttính < t(p;f) chấp nhận H0 tức x = (giống nhau) (ở mức ý nghĩa 0,05) PbII không ảnh hưởng đến phép xácđịnh CuII…) Nếu ttính > t(p;f) bác bỏ H0 (hay chấp nhận Ha) tức x (ở mức ý nghĩa 0,05) PbII có ảnh hưởng đến phép xácđịnh CuII…) Bài tốn 2: So sánh hai giá trị trung bình x1 & x2 16 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Giải: Tiến hành n1 thí nghiệm thu x1 & S12 Tiến hành n2 thí nghiệm thu x2 & S 22 Giả thiết S12 S 22 (hay độ lặp lại nhau) Tính phương sai cho hai tập SLTN: S pooled S pooled S x x2 Tính ttính S pooled (n1 1) S12 (n2 1) S 22 (n1 1) (n2 1) pooled (n1 1) S12 ( n2 1) S 22 (n1 1) ( n2 1) n1n2 n1 n2 ; n1 = n2 = n t tính x1 x2 S pooled n So sánh ttính với t(p; f=n1+n2-2) ; (thí dụ p=0,05)) Kết luận ttính < t(p; f=n1+n2-2) chấp nhận H0 hay ttính > t(p; f=n1+n2-2) bác bỏ H0 hay x1 x2 x1 x2 Chú ý: Nếu S12 S 22 (độ lặp lại khác nhau) đề nghị áp dụng phương pháp gần để so sánh 2 S1 S1 n n f 12 S12 S 22 n1 n2 n1 1 n2 x1 & x2 t tính x1 x2 S12 S 22 ; n1 n2 (làm tròn f) Tiếp theo tương tự Đo nhiều mẫu khác Bài toán 3: Tiến hành đo đại lượng nhiều mẫu có hàm lượng hay nồng độ khác hai phương pháp khác nhau, hai thiết bị khác nhau, hai người làm thí nghiệm Hai phương pháp khác nhau, hai thiết bị khác nhau, hai người làm thí nghiệm có cho kết thí nghiệm khác không? 17 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HỐ SỐ LIỆU STATISTICS FOR CHEMISTS Mục đích toán kiểm tra xem Hai phương pháp khác nhau, hai thiết bị khác nhau, hai người làm thí nghiệm có mắc sai số hệ thống khơng? Giải: Tiến hành đo phương pháp thu kết x1; x2; ; xn Tiến hành đo phương pháp thu kết y1; y2; ; yn Đánh giá xem xi – yi hay khác không? Ta tiến hành xác định d i yi xi hay (d i xi yi ) d di n Tính Sd Tính t tính d i d n d Sd (0 d ) n So sánh ttính với t(p=0,95);f=n-1) Nếu ttính < t(p=0,95);f=n-1) chấp nhận giả thiết H0 (d0) kết luận kết hai phương pháp nhau; phương pháp không mắc sai số hệ thống so với phương pháp (phương pháp chuẩn) Nếu ttính > t(p=0,95);f=n-1) bác bỏ giả thiết H (d0) kết luận kết hai phương pháp khác nhau; phương pháp mắc sai số hệ thống so với phương pháp (phương pháp chuẩn) Chú ý: Phương pháp áp dụng trường hợp hàm lượng hay nồng độ không lớn 10n lần TD: Xác định hàm lượng PbII mẫu phân tích hai phương pháp khác Mẫu 71 61 50 60 pp chiết trực tiếp: 76 68 48 57 pp oxh ướt: (phân tích phương pháp AAS) Hàm lượng PbII hai phương pháp có khác hay khơng? Ta có: di = -5 ; -7 ; ; d 1,75); S d 4,99 18 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS ttính = 0,7 < t(p=0,05; f=3) = 3,18 chấp nhận giả thiết H (d0) kết luận kết hai phương pháp nhau; phương pháp không mắc sai số hệ thống so với phương pháp (phương pháp chuẩn) Khái niệm kiểm tra (Test) hai phía phía (2 tails ; tails – đuôi đuôi) Kiểm tra hai phía so sánh hai đại lượng vối nhau: x1 & x2 ; bắt buộc phải tra chuẩn t, F, 2 (ở mứ ý nghĩa p = 0,05 hai phía) Kiểm tra phía biết chắn đại lượng ln nằm phía đại lượng TD: chuẩn độ axit bazơ dùng thị: phenolftalein (pT = 9) CA lớn; Metyl da cam (pT = 5) CA nhỏ Một phương pháp chuẩn phải cho kết tốt ; Một phương pháp phải cho kết tốt x ( x >) Phương pháp chuẩn phải có độ lặp lại S12 tốt; phương pháp có độ lặp lại S 22 tốt ( S12 < S 22 ) Thídụ (tr 59 – 60 / Miller): Người ta nghi ngờ phương pháp chuẩn độ axit – bazơ bị mắc sai số hệ thống dương (systematic error hay bias) Để kiểm tra, người ta chuẩn độ 25),00 ml dung dịch NaOH 0,1M dung dịch chuẩn axit 0,1M kết sau: 25),06 25),18 24,87 25),5)1 25),34 25),41 (n = 6) Giải: V 25),228 ml ; SV 0,228 ml ; V 25) t tính 25),228 25) 0,228 2,35) > t p 0,05); f 5) 2,02 Kết luận: phương pháp chuẩn độ mắc sai số hệ thống So sánh độ lặp lại hai tập SLTN Mục đích: so sánh hai phương sai: đo mấu đo hai mẫu khác Bài toán 4: Tiến hành n1 thí nghiệm thu x1 & S12 Tiến hành n2 thí nghiệm thu x2 & S 22 Vấn đề? Độ lặp lại hai thí nghiệm có khơng? Giả thiết S12 S 22 (hay độ lặp lại nhau) Giải: Tính chuẩn F: Ftính S12 giả sử S12 S 22 (vì F > 0) S 22 19 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Tra bảng F(p=0,05); f1=n1-1; f2=n2-1) So sánh Ftính < F(p;f1;f2) chấp nhận giả thiết H0 hay độ lặp lại hai thí nghiệm Ftính > F(p;f1;f2) bác bỏ giả thiết H0 hay độ lặp lại hai thí nghiệm khác Chú ý: Có hai trường hợp: + Nếu biết S12 S 22 (phương pháp phương pháp chuẩn) sử dụng Test phía (tra P phía) + So sánh S12 & S 22 tra bảng P hai phía Phạm vi ứng dụng tốn: + Nghiên cứu ảnh hưởng yếu tố + Nghiên cứu phát triển phương pháp (Method Development): so sánh S12 & S 22 phương pháp chuẩn phương pháp + Hỗ trợ cho toán so sánh hai giá trị trung bình (bài tốn 2) Khí làm tốn 2, trước hết phải so sánh: S12 S 22 So sánh hai giá trị trung bình Nếu S12 S 22 sử dụng phương pháp gần Thí dụ: So sánh phương pháp xác định COD (nhu cầu oxi hoá học) với phương pháp chuẩn (dùng muối HgII) phân tích mẫu nước thải người ta thu kết sau: x (mg/l) Phương pháp mới: 72 Phương pháp chuẩn: S (mg/l); n =8 1,5)1 72 3,31 Độ lặp lại phương pháp có hiệu phương pháp chuẩn hay khơng? Giải: F7; S 22 3,312 4,8 F ( p 0,05); 7; 7) 3,787 S12 1,5)12 S12 S 22 Phương pháp có độ lặp lại cao So sánh phương sai mẫu với phương sai cụ thể Áp dụng chuẩn 2 Chú ý: + Chuẩn F nhạy trường hợp phương sai có tính cộng tính 20 ... 7,2064 70000 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Như sai số kết đo phải cho với sai số lớn số, nghĩa kết y = 7,2 hay nói cách khác sai số V định sai số phép đo Khi... II XỬ LÝ VÀ KIỂM TRA SỐ LIỆU THỰC NGHIỆM II.1 Xử lý số liệu thực nghiệm: Bài toán 1: Xác định khoảng tin cậy/biên giới tin cậy ( ) Chưa biết độ lệch chuẩn S: 11 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ... C2D(x) với x biến số; D(c+x) = D(c) + D(x) = D(x); D(xy) = D(x) D(y) với x,y biến số; XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Hệ quả: KQTN thường mắc sai số nhiều nguyên