xử lý số liệu Khi tiến hành các thí nghiệm ta thu được nhiều số liệu gọi là tập số liệu thực nghiệm (SLTN) (Data set). Các vấn đề đặt ra đối với KQTN trên là: Độ tin cậy của các giá trị trên như thế nào? (sai số, %...) Yếu tố ảnh hưởng đến KQTN như: pH; C; t0;… ảnh hưởng đến hiệu suất phản ứng? Có thể biểu diễn các ảnh hưởng bằng phương trình toán học được không (mô hình hoá thí nghiệm)? Điều kiện tối ưu để thu được KQTN tốt nhất (tối ưu hoá thí nghiệm – Experimental Optimization)? Tất cả những câu hỏi trên đề có thể giải quyết được bằng phương pháp thống kê.
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HỐ SỐ LIỆU STATISTICS FOR CHEMISTS MỤC ĐÍCH: Khi tiến hành thí nghiệm ta thu nhiều số liệu gọi tập số liệu thực nghiệm (SLTN) (Data set) Các vấn đề đặt KQTN là: Độ tin cậy giá trị nào? (sai số, % ) Yếu tố ảnh hưởng đến KQTN như: pH; C; t 0;… ảnh hưởng đến hiệu suất phản ứng? Có thể biểu diễn ảnh hưởng phương trình tốn học khơng (mơ hình hố thí nghiệm)? Điều kiện tối ưu để thu KQTN tốt (tối ưu hố thí nghiệm – Experimental Optimization)? Tất câu hỏi đề giải phương pháp thống kê Chương I MỘT SỐ KHÁI NIỆM CƠ BẢN KQTN sai số kèm đại lượng ngẫu nhiên (nhận giá trị khoảng xác định) Mỗi đại lượng ngẫu nhiên (ĐLNN) có hai đặc trưng “Tâm” (giá trị trung bình) độ phân tán kết Vậy, đại lượng mơ tả tâm / độ phân tán gì? I.1 Giá trị trung bình: Mơ tả “tâm” ĐLNN/ tập SLTN Trung bình số học (Mean): Đây đại lượng thường dùng thống kê Ta tiến hành n thí nghiệm thu kết quả: x1, x2,…, xn Thì trung bình số học tính theo công thức: n x i xi x i 1 hay x n n x Tính chất: Tổng độ lệch 0: i x 0 Trung bình bình phương: xbp x n i x Trung bình nhân: xnh n xi lg xnh lg xi xnh x n Trung vị / số (Median): giá trị đứng gữa n n 1 Nếu n chẵn thì: Trung vị = Nếu n lẻ thì: Trung vị = số (sắp xếp cấcgí trị từ thấp đến cao) Lưu ý: Arerage: Mô tả chung cho giá trị mà khơng nói rõ giá trị I.2 Các đại lượng đặc trưng cho độ phân tán ĐLNN hay tập SLTN Khoảng biến động/ khoảng dao động (Range): R = xmax - xmin Phương sai (Variance): Được ký hiệu là: XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU S2 x xi x n hay i x n S STATISTICS FOR CHEMISTS ; với n số thí nghiệm n > 30 x i x i n ; với n số thí nghiệm n < 30 n Phương sai đại lượng mô tả lặp lại phân tán số liệu thực nghiệm Với n – bậc tự (Freedom degree) (nếu biết n -1 độ lệch ta tìm độ lệch cịn lại; bậc tự n -1 với ý nghĩa có n -1 số liệu tự số liệu lại chịu ràng buộc để tổng độ lệch không ( xi x 0 )) (Phương sai khó hình dung có thứ ngun bình phương) Tính chất phương sai: ( S , D ) D(c) = với c = const; D(cx) = C D(x) với x biến số; D(c+x) = D(c) + D(x) = D(x); D(xy) = D(x) D(y) với x,y biến số; Hệ quả: KQTN thường mắc sai số nhiều nguyên nhân khác như: - Bản thân phương pháp đo: S12 - Kỹ thuật lấy mẫu (mẫu có đại diện khơng?) S 22 - Thời gian lấy mẫu, không gian,……….: S 32 ,… 2 Như sai số tổng cộng tổng sai số: S S i 2 Nếu giá trị đo cho hàm số y = f(x1, x2,…, xi, , xn) S y S i Độ lệch chuẩn (SD: Standard Deviatim): Ký hiệu (nếu n > 30) S (nếu n < 30) 2; S S2 x x i x i x i n n n , S mô tả tốt độ lặp lại / độ phân tán KQTN (ĐLNN) có thứ ngun trùng với thứ nguyên đại lượng đo (Đo – Measurement; Phân tích – Analysis; Tính,….) Thí dụ: [PbII] = (1,0 0,5))g/l (1ppb = g/l) ( ppm: Parst Per Million: phần triệu (10 -6) (ppb: Parst Per Billion : phần tỷ(10 -9) (ppt: Parst Per trillion : phần nghìn tỷ(10 -12) Vd: 0,033% = 330 ppm Độ lệch chuẩn tương đối (RSD: Relative Standard Deriation; CV: Coefficient of Variation) 100.S RSD(%) CV (%) x Chú ý: + , S2, S, RSD, CV mô tả sai số đại lượng đo mô tả sai số ngẫu nhiên + Trong phân tích đo lường, xác định giá trị nhỏ sai số (RSD) lớn Vấn đề đặt xác định nồng độ RSD chấp nhận (Trace Analysis: phân tích vết C ppm; Ultra Trace Analysis: phân tích siêu vết C ppb) XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Để trả lời câu hỏi trên, người ta thấy C RSD có mối quan hệ theo hàm Horwitz RSD 2 (1 0,5) lg C ) Khi C = 1ppb = 10-9 RSD = +RSD 25),5) = 45),25) (%) – RSDHorwitz kết phịngthí nghiệm giới Trong nội phịng thí % %0 ppm ppb … C nghiệm RSD = ½ RSDHorwitz chấp nhỏ dần nhận -RSD RSDHorwitz xác định hệ thống kiểm tra nội nghiệm – Collaborative Testing (phân tích mẫu phương pháp) Hệ thống kiểm tra liên phòng thí nghiệm – Interlaborative Testing (phân tích nhiều phương pháp khác mẫu) RSD gần với RSDHorwitz I.3 Sai số (Erorr): Là độ lệch đại lượng đo giá trị thực nó: Sai số = x - Trong thực tế thường ta giá trị thực đại lượng đo Do vậy, để mô tả sai số người ta dùng S, RSD, CV, (biên giới tin cậy), U (Uncertrainty: độ bất ổn định / độ không đảm bảo đo/ độ không chắn/ độ không xác định / sai số mở rộng đại lượng đo) Để xác định giá trị thực đại lượng đo, theo quy định quốc tế ta phải phân tích mẫu chuẩn hay mẫu vật liệu so sánh cấp chứng (mẫu CRMs: Certified Refference Materials) (Mẫu CRMs số hãng giới sản suất) Độ đúng/ độ xác/ mức xác – Accuracy: Độ = x - Chỉ xác định độ phân tích mẫu chuẩn CRMs Các loại sai số: (1) Sai số ngẫu nhiên (SSNN) – Random Erorr/ Indeterminate Erorr): sai số ln bắt gặp cácthí nghiệm; âm dương Thơng thường, để giảm SSNN người ta thường tăng số thí nghiêm lên (2) Sai số hệ thống (SSHT) – Systematic Erorr/ Determinate Erorr: sai số nằm phía giá trị thực (hay giá trị trung bình x ); âm dương Ngun nhân: - Do hố chất bẩn - Do thiết bị khơng xác - Do thân phương pháp - D kỹ theo tác … Để giảm SSHT cần kiểm soát nguyên nhân (3) Sai số thô – Outlier Chú ý: + S, RSD, CV, mô tả sai số ngẫu nhiên (hay độ lặp lại/ độ phân tán) KQTN U (sai số tổng cộng): bao hàm SSNN SSHT Trong thực tế người ta thường biểu diễn KQTN dạng: x S (n=?) x RSD (n=?) XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS + S, U, : biểu diễn sai số tuyệt đối (chúng có thứ nguyên với đại lượng đo); RSD, CV: biểu diễn sai số tương đối (thứ nguyên %) Thí dụ: [CuII] = (0,10,2)ppb [PbII] = (5,00,5)ppb So sánh xem phép xác định xác hơn? 0,2.100 0,5).100 RSDCu II 20%; RSDPb II 10% 1,0 5),0 Như phép xác định PbII xác Mặc dù SCu(II) < SPb(II) + Độ lặp lại – Precision: có trường hợp: - Thí nghiệm điều kiện đồng (cùng thời gian, thiết bị, hoá chất, người làm) Độ lặp lại – Repeatability - Thí nghiệm điều kiện khơng đồng Độ thu hồi/ độ phục hồi – Reproducility (khác với độ thu hồi - Recovery: thường dùng để đánh giá phép đo) Thí dụ: Khi đo mẫu PbII: Lần mẫu PbII ta đo [PbII]= 1,0 ppb Lần mẫu PbII + 0,5ppb ta đo [PbII]= 1,3 ppb 1,3 100 85)(%) Độ thu hồi phép đo: Re v 1,0 0,5) (Spike: thêm ít; Addition: thêm nhiều) Kết luận: Để đánh giá độ (accuracy), người ta tiến hành cách sau: + Phân tích mẫu chuẩn CRMs + Thêm chất phân tích vào mẫu (Spike) xác định độ thu hồi + Phân tích phương pháp chuẩn để so sánh kết đo với kết đo phương pháp chuẩn Cách lấy số có nghĩa: Trong Hố học, kết thí nghiệm thu ln mắc sai số Vì vậy, việc lấy giữ lại số có nghĩa quan trọng Con số có nghĩa số biểu diễn cho có số cuối sai, nghã số đứng trước số Để giữ lại số có nghĩa, phải dựa vào độ lệch chuẩn S hay RSD Nếu khơng có S, RSD ta dựa vào hàm Horwitz: RSD 2 (1 0,5) lg C ) hay S RSD.x (1 0,5) lg C ).x 100 100 Thí dụ 1: %TiO2 = 0,35)2 % 0,4 %; C = 4.10-3 3 RSD 2 (1 0,5) lg C ) 2 (1 0,5) lg( 4.10 ) 2 2, 5)% S RSD.x 5).0,4 0,02 (như ta lấy số sau dấy phảy) 100 100 Thí dụ 2: y = 3,2 (ml) 2,25)2 (mg/ml) = 7,2064 (mg) Ta có sai số thể tích là: Ta có sai số nồng độ là: Ta có sai số y là: 0,1 3,2 30 0,001 SC 2,25)2 2000 0,0001 Sy 7,2064 70000 SV Như sai số kết đo phải cho với sai số lớn số, nghĩa kết y = 7,2 hay nói cách khác sai số V định sai số phép đo Khi Sy = 1/72 S (Signal) S2 b2 x2 b1 x1 S1 x XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Độ tin cậy phép đo đánh giá qua thông số sau: + Độ lặp lại: S, RSD/ CV S Nếu hệ số góc b x + Độ nhạy (Sensitivity) Độ dốc đường chuẩn = lớn độ nhạy cao ngược lại + Giới hạn phát (DL: Detection Limit): mơ tả khả định tính phương pháp DL nồng độ nhỏ chất phân tích mà ta phát cách tin cậy Thực tế ta nên xác định giới hạn định lượng (QL: Quantitation Limit) QL = ÷ DL I.4 Phân bố Phân bố thực nghiệm Thực thí nghiệm thu KQTN: x1, x2, …, xn Vấn đề đặt kết phân bố nào? Để xác định phân bố KQTN người ta tiến hành sau: Chia SLTN thành khoảng d tương đương nhau: d n Xác định tần xuất SLTN khoảng di xác định m ni i ; ni: số lần xuất kết xi khoảng di n Biểu diễn kết lên hệ toạ độ: ni = f(xi) ni ni xi 5) … Phân bố thực nghiệm ni xi Phân bố lệch trái xi Phân bố lệch phải Nếu xi gần với có tần xuất max Phân bố KQTN thông thường đối xứng KQTN tốt; KQTN phân bố lệch Để trở đối xứng ta xây dựng ni = f(lgxi) Phân bố lý thuyết a Phân bố chuẩn/ phân bố Gauss – Normal Distribution / Gauss Distribution: Các SLTN sai số Hoá học tuân theo phân bố chuẩn Hàm phân bố chuẩn: - 1 2 y e 2 x Trong đó: x: KQTN : Độ lệch chuẩn (n lớn) : Giá trị thực đại lượng đo x Dạng đồ thị: Nhận xét: 2 y 5) - + Phân bố chuẩn x XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Xác xuất P (Probality) thu nằm miền {- ÷ +} P ydx 0,68 68% P(-2 < x < +2) = 95)% P(-3 < x < +3) = 99,7% P: gọi xác xuất tin cậy (Confidence Prob) = 68%; 95)%;… gọi độ tin cậy/ mức tin cậy (Confidence Level) Ở P hay cao sai số lớn Thơng thường người ta hay chấp nhận = 95)%; P = 0,95) Người ta lấy biên giới 3 để phân biệt SSHT SSNN (ngồi miền SSHT khơng chấp nhận được; miền SSNN) Hàm y hàm xác xuất phụ thuộc vào hai biến ( p = f(,) Để lập bảng tra cứu người ta chuẩn hoá hàm Gauss: Đặt u x 0; u 1 u ( y D (u ) D( x) D ( ) 1 ) u2 2 2 y e 2 Tiến hành lập bảng: Biết u P; Biết P u u2 u Phân bố Gauss Lưu ý: + Đại lượng u thực tế kiểm tra nội nghiệm kiểm tra liên nghiệm đại lượng gọi “Zscore” Z tốt (chất lượng phịng thí nghiệm tốt); cịn phịng thí nghiệm có Z > PTN có chất lượng tồi + Trong thực tế số phịng thí nghiệm tham gia phân tích > 30 (n > 30) nên phân bố chuẩn có ý nghĩa lý thuyết dùng đánh giá số liệu Khi biết giá trị riêng lẻ đại lượng đo (ĐLNN) ta tính độ lệch chuẩn x (ĐLNN) có x ? Khi đo mẫu: n =3 x1 n =7 x2 n =10 x3 …………… x x xn n 2 x2 ; x n n n Trong thực tế, biểu diễn KQTN người ta thường ghi kèm độ lệch chuẩn số thí nghiệm n Thí dụ: Điểm trung bình lớp với 5)0 HS 7,2 1,0 (n = 5)0) , 1,0 5)0 Từ phân bố chuẩn ta xác định biên giới tin cậy : x x u x u Khi biểu diễn KQTN người ta thường ghi xác xuất tin cậy Thí dụ: 1,0 0,3 ( P 0,95); n 3) u u ; ( x ; x ) n n n Thường thực tế người ta biểu diễn: x ( P; n) Đối với giá trị trung bình: x XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS b Phân bố Student (phân bố t): Trong thực tế người ta thường tiến hành với số thí nghiệm n nhỏ nên khơng thể dùng phân bố chuẩn để đánh giá KQTN (vì sai lệch nhiều) Trong trường hợp này, người ta đề nghị dùng phân bố Student để đánh giá KQTN (bù lại sai lệch đánh giá qua phân bố chuẩn) Hàm phân bố t phức tạp chứa biến t (chuẩn t/ chuẩn Student) biến f (bậc tự do) Dạng phân bố t tương tự phân bố chuẩn phụ thuộc vào f f lớn (n lớn) phân bố t tiến tới phân bố chuẩn Chuẩn t: t x x S ; t Sx S n tS tS x ; n n ; Sx (t ) S n f = 10 t t = n t = f(p,f = n-1) người ta lập bảng tra cứu Nếu P = const f tăng t giảm Nếu f = const P tăng t tăng Lưu ý: S t phải bậc từ Nếu số thí nghiệm n lớn t(P=0,95); f) = 1,96 khí 2 f = 20 (F ) f , f c Phân bố Fischer (phân bố F): Tiến hành thí nghiệm với: n1 S12 n2 S 22 F t = Để so sánh độ lặp lại ( S12 , S 22 )của hai dãy thí nghiệm trên, người ta dùng chuẩn Fischer Dạng hàm phân bố: F f ( F , f1 , f ) Dạng phân bố F giống dạng phân bố t nằm góc dương trục toạ độ Decacter Khi f1 & f2 phân bố F tiến đến phân bố chuẩn S12 Tính F: F Vì F nên tính ta đặt phương S2 sai lớn tử số ( )f1, f2 d Phân bố “khi bình phương” (2) Vấn đề: Có quần thể phương sai 2 Nếu lấy mẫu quần thể để đo (với n nhỏ) S2 Vấn đề đặt độ lặp lại 2 S2 có giống khơng? Để trả lời câu hỏi người ta sử dụng phân bố 2 2 2 Dạng hàm: f ( , f n 1) t = Khi f phân bố 2 tiến đến phân bố chuẩn Dạng đồ thị tương tự phân bố F S2 x x Tính : (n 1) i 2 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU Chương II STATISTICS FOR CHEMISTS XỬ LÝ VÀ KIỂM TRA SỐ LIỆU THỰC NGHIỆM II.1 Xử lý số liệu thực nghiệm: Bài toán 1: Xác định khoảng tin cậy/biên giới tin cậy ( ) Chưa biết độ lệch chuẩn S: Bài tốn: Tiến hành thí nghiệm n lần thu kết n x1, x2, , xn x Giải: - Tính trung bình số học (Mean): x i n - Tính độ lệch chuẩn: S x i x n t ( p 0, 95); - Biên giới tin cậy: f n 1) S n ; tra bảng tìm giá trị t p=0,95) f =n –1 (nếu n > 30 chấp nhận t = 2, Từ ta có: 2S ) n x ( p 0,95); f n ?) Biết RSD/CV: x 100S x RSD(%) RSD(%) S ; x i x 100 n t ( p 0,95); f n 1) S ; Khi RSD/CV cho trước thường người n ta chấp nhận n → ∞ chấp nhận t = → 2S n Lưu ý: việc xác định hay S , S phép đo (Method) chấp nhận phép đo mắc sai số ngẫu nhiên Trong thực tế để đo đại lượng cần phải làm nhiều cơng đoạn: - Lấy mẫu (mắc sai số lấy mẫu (Sspl: Sampling)) - Xử lý mẫu, đo, xử lý số liệu, báo cáo kết (mắc sai số phép đo – measurement SMeas Như sai số phương pháp là: S2=S2spl+S2meas Tuy nhiên, lấy sai số S, phép đo giả thiết bỏ qua Sspl Thực tế nhiều trường hợp sai số lấy mẫu lớn định đến sai số phép đo (Procedure: quy trình, thủ tục) dẫn đến: Hệ quả: Nếu sai số lấy mẫu lớn định sai số phương pháp khơng cần phải sử dụng phép đo xác ngược lại Một vấn đề dặt mẫu khác có ảnh hưởng đến kết đo hay không? Để trả lời câu hỏi ta phải dùng phương pháp phân tích phương sai (ANOVA: Analysis Of Variance) Bài tốn 2: Xác định số thí nghiệm (n) để dùng phương pháp có S (hoặc RSD) không mắc sai số vượt giới hạn cho phép Cụ thể: Giả sử cần đo đại lượng x phương pháp có S/RSD Yêu cầu sai số đo x (sai số tuyệt đối/tương đối) Giải: tS n tS 2S n ; t ( p 0,95); f n 1) 2 n Chú ý: Nếu cho trước RSD, x ta tính S x RSD (%) ; n 100 số thí nghiệm nên phải làm trịn XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS Thí dụ: Xác định % Fe2O3 ddaats cowx 1% ÷ 5)% phương pháp chuẩn độ Complexom (dùng Complexom II/ trilon B Na2H2Y) có RSD(%) = 2,0% Hỏi phảp tiến hành thí nghiệm để sai số không 5)% (chấp nhận không măc sai số lấy mẫu) Giải: - Tính : Fe2 O3 1% - Tính S 5).1 1 0,05)%; Fe2 O3 5)% 100 5).5) 5) 0,25)% 100 x RSD (%) : 100 Fe2 O3 1% 2,0 S1 0,02%; Fe2 O3 5)% 100 S 5) 5) 2,0 0,1% 100 - Tính n: 2 2S 0,02 n1 0,64 1; 0,05) 1 2S n5) 5) 5) 2 0,1 0,64 1 0,25) Bài tốn 3: Chọn phương pháp đo/ phân tích Nội dung: Chon phương pháp phương pháp A, B, C, D,… để đo x cho với n thí nghiệm đạt sai số mong muốn ( ) (tương đối, tuyệt đối) Giải: Các phương pháp A, B, C, D,… có CVi (Si) tương ứng (cho trước) Cần tính độ lệch chuẩn S* (CV*) so sánh với Si (CVi) Chọn phương pháp có Si (CVi) < S* (CV*) Biết tS n S* ; t n t ( p 0,95); f ) 2 Hiểu tiến hành số thí nghiệm lớn CVi/Si ứng với n S* n 100S* CV * x + So sánh CVA, CVB, CVC, CVD, … với CV* chọn phương pháp có CV i< CV (hoặc so sánh Si với S* chọn phương pháp có Si < S*) * Thực tế, tài liệu phương pháp đo công bố S (hoặc CV) ứng với x Thực tế x dao động khoảng rộng người đo/ phân tích phải xác định lại S (CV) ứng với khoảng x cần đo Phức tạp, khó so sánh kết đo Do vậy, người ta đề nghị chọn phương pháp có hiệu lực (VAM: Valiđate Analysis Measurement) Tính pháp lý cao Lưu ý: + Trong GLP (Good Laboratory Practice ) bắt buộc dùng phương pháp VAM + Để có phương pháp VAM phải trải qua giai đoạn - GĐ1: Nghiên cứu nội PTN đưa phương pháp - GĐ2: Áp dụng phương pháp cho nhiều PTN để xem phương pháp có tốt khơng (độ lặp lại, độ đúng, độ hồi phục,…) Phân tích một vài kiểu mẫu - GĐ3: Áp dụng phương pháp cho nhiều PTN phân tích nhiều kiểu mẫu khác khoảng thời gian, không gian xác định (vài tháng, năm) xem có tốt khơng Nếu tốt thừa nhận VAM * XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH HOÁ SỐ LIỆU STATISTICS FOR CHEMISTS II.2 Kiểm tra số liệu thực nghiệm Nguyên tắc chung: Nhiều ta cần phải so sánh hai kết đo: + x (của phương pháp đó) với (mẫu CRMs) + x (của người này/ phương pháp/PTN /ngày….) với x (của người khác/ phương pháp/PTN /ngày…khác) + So sánh độ lặp lại hai tập SLTN ( S12 & S 22 ) Để giải vấn đề: Tiến hành “KIỂM TRA GIẢ THIẾT THỐNG KÊ (Significance)” làm để KTGTTK Chấp nhận giả thiết H0 Đánh giá độ giả thiết H0 Tính (áp dụng thống kê xác suất) xác suất loại bỏ H0/ bác bỏ H0 Xác suất gọi mức ý nghĩa P (%) (t) = f (t;f) từ t,f So sánh P với “chuẩn” để đánh giá giả thiết H0 Trong thực tế, người ta tính chuẩn thống kê (t, F, 2) từ số liệu thực nghiệm (SLTN) thu ta giá trị t tính, Ftính, 2tính,… sau tra bảng để xác định chuẩn thống kê mức ý nghĩa t(p; f); F(p; f 1; f2; ); … sau so sánh giá trị chuẩn thống kê tính với chuẩn thống kê tra bảng đến nhận xét/ kết luận Nếu ttính < t(p;f) ta chấp nhận giả thiết H – hai đại lượng so sánh không khác / không khác có ý nghĩa mặt thống kê; hay nói cách khác mắc sai số ngẫu nhiên khơng mắc sai số hệ thống Ngược lại, ttính > t(p;f) ta bác bỏ giả thiết H0; chấp nhận giả thiết thay Ha (Alternative) Kết luận hai đại lượng đo khác hay mắc sai số hệ thống Chú ý: Trong thống kê, mà kết luận sai; có mà kết luận khơng ta gọi sai số loại Ngược lại, sai mà kết luận đúng, không mà kết luận có ta gọi sai số loại Trong nghiên cứu, người ta mong ss loại Xác suất ss loại nhỏ; nhỏ đến mức tuỳ thuộc Mẫu vào người nghiên cứu (thí dụ: Mỹ chấp nhận 7% Mẫu trắng p=0,07; châu Á, EU: 5% p=0,05) Nhiều báo cáo kết người ta ghi mức ý nghĩa p kèm Thí dụ: STT KQ đo p x1 0,001 Biến x x2 0,09 1=0 20 ss loại ss loại Khi chấp nhận H0 tức khơng có sở để bác bỏ H0 chưa II.3 ÁP DỤNG: Trường hợp đo mẫu Bài toán 1: So sánh x & Thí dụ: So sánh kết phân tích mẫu chuẩn CRMs () với giá trị thông báo chứng mẫu CRMs ( ) 10