Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 34 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
34
Dung lượng
2,63 MB
Nội dung
MỞ ĐẦU Thống kê ứng dụng hóa học Nghiên cứu hóa học (khảo sát ảnh hưởng, phân tích, đo lường…) → Kết (tập số liệu thực nghiệm số liệu đơn lẻ) Các vấn đề đặt ra? Xử lí số liệu thực nghiệm (trung bình, sai số, ε…) Thủy Châu Tờ, ThS Khoa Khoa học Tự nhiên – Trường Đại học Thủ Dầu Một thuychauto@gmail.com Đánh giá ảnh hưởng thông số khảo sát Mơ hình hóa thí nghiệm: hồi qui tuyến tính, hồi qui đa biến (biễu diễn phương trình tốn) Tối ưu hóa thực nghiệm: điều kiện để đạt kết tốt nhất… Cần có cơng cụ/biện pháp theo dõi/giám sát/đánh giá “chất lượng” kết thực nghiệm thống kê (Statistics) Nội dung Tài liệu tham khảo Lê Đức Ngọc, Nhập môn xử lý số liệu kế hoạch hóa thực nghiệm, Nxb ĐHQG Hà Nội, 2011 Chương Một số khái niệm Chương Thống kê mô tả James N Miller, Jane C Miller, Statistics and Chemometrics for Analytical Chemistry, 6th Ed, Pearson Education Limited, 2010 Chương Hàm phân bố chuẩn phân bố Nguyễn Văn Lân, Xử lý thống kê số liệu thực nghiệm phòng thí nghiệm, Nxb Đại học Quốc gia TP Hồ Chí Minh, 2014 Chương Xử lý kiểm tra số liệu thực nghiệm Chương Tương quan hồi quy tuyến tính Chương Kế hoạch hóa thực nghiệm Chương MỘT SỐ KHÁI NIỆM CƠ BẢN 1.1 Sai số nguồn gốc gây sai số 1.1 Sai số nguồn gốc gây sai số Sai số (error) sai khác giá trị thực nghiệm thu so với giá trị mong muốn Tất số liệu đo / phân tích thu từ thực nghiệm mắc sai số độ không chắn / độ bất ổn số liệu đo / phân tích 1.2 Phân loại sai số 1.3 Cách biểu diễn sai số 1.4 Tổng thể mẫu Nguồn gốc gây sai số: Chủ quan: thao tác thí nghiệm thiếu chuẩn xác, lấy mẫu phiến diện, đọc sai số liệu Dụng cụ / thiết bị đo: không hiệu chỉnh, môi trường làm việc Phương pháp/quy trình: phản ứng hóa học khơng hồn tồn, thị đổi màu xa điểm tương đương, độ tan kết tủa… Tùy trường hợp cụ thể mà xác định nguồn sai số (kết hợp lý thuyết thực nghiệm) 1.5 Độ lặp lại độ 1.6 Chữ số có nghĩa cách lấy giá trị gần 1.2 Phân loại sai số 1.2 Phân loại sai số Có loại sai số: sai số hệ thống (SSHT), sai số ngẫu nhiên (SSNN) sai số thô (SST) (1) Sai số hệ thống (systematic hay determinate error) Khái niệm: SSHT sai số nguyên nhân cố định gây ra, lặp lặp lại thí nghiệm Các giá trị ln nằm phía so với giá trị thực SSHT ảnh hưởng đến độ kết đo /phân tích Nguyên nhân: Do chất phương pháp: phản ứng hóa học khơng hồn tồn, chất thị đổi màu xa điểm tương đương, Do dụng cụ, thiết bị đo thiếu xác Do hóa chất, thuốc thử không tinh khiết pha nồng độ dung dịch chuẩn bị sai Loại trừ SSHT: SSHT gây nguyên nhân biết trước tìm cách giảm thiểu SSHT: Dựa vào sở lý thuyết trình tự thí nghiệm, tính tốn để phát SSHT gây giai đoạn Sử dụng dụng cụ, thiết bị đo xác; hiệu chỉnh dụng cụ, thiết bị trước đo Tinh chế lại hóa chất, thuốc thử không tinh khiết trước sử dụng… 1.2 Phân loại sai số 1.2 Phân loại sai số (2) Sai số ngẫu nhiên (random hay indeterminate error) Khái niệm: SSNN sai số gây nguyên nhân không cố định, trước, thay đổi không theo qui luật Các giá trị ln nằm hai phía so với giá trị thực SSNN ảnh hưởng đến độ lặp lại kết phân tích Nguyên nhân: Khách quan: nhiệt độ, áp suất, độ ẩm, điện Chủ quan: cân sai, đọc sai, thao tác thí nghiệm thiếu chuẩn xác, thành phần chất nghiên cứu không đồng nhất… Giảm thiểu SSNN: Tăng số lần thí nghiệm Sử dụng dụng cụ, thiết bị có độ xác cao Xử lý kết thí nghiệm phương pháp thống kê Sai số ngẫu nhiên làm cho kết phân tích khơng chắn, sai số hệ thống làm cho kết quảphân tích sai (3) Sai số thô (outlier) Khái niệm: STT kết thực nghiệm xuất lớn bé so với kết khác tập kết thực nghiệm Nguyên nhân: Khách quan: thiết bị đo; điều kiện môi trường: điện áp khơng ổn định, điều kiện khí hậu (tốc độ gió, nhiệt độ, áp suất ) Chủ quan: thao tác hay đọc kết sai, thao tác thí nghiệm sai… Xác định loại trừ STT: dùng chuẩn Dixon, chuẩn Student… (chương 3) 10 1.2 Phân loại sai số 1.3 Cách biểu diễn sai số Ví dụ 1: Bốn sinh viên A, B, C D tiến hành chuẩn độ 10 ml dung dịch chuẩn NaOH 0,100 M dung dịch chuẩn HCl 0,100 M, sinh viên chuẩn độ lặp lại lần cho kết sau: (1) Sai số tuyệt đối (absolute error) Sai số tuyệt đối kết thực nghiệm hiệu số số giá trị thật (hay giá trị trung bình) STT Sinh viên A 10,08 10,11 10,09 10,10 10,12 Sinh viên B 9,88 10,14 10,02 9,80 10,21 Sinh viên C 10,19 9,79 9,69 10,05 9,78 Sinh viên D 10,04 9,98 10,02 9,97 10,04 ε x - μ hay ε x - x Trong đó: (1.1) : sai số tuyệt đối x: kết thực nghiệm : giá trị thực giá trị x x : giá trị trung bình - dương hay âm - có đơn vị trùng với đơn vị đại lượng đo - Sai số tuyệt đối khơng cho phép đánh giá độ xác phép đo Xác định loại sai số mắc phải sinh viên (SSHT&SSNN)? 11 12 1.3 Cách biểu diễn sai số 1.3 Cách biểu diễn sai số (2) Sai số tương đối (relative error) Sai số tương đối () số tỷ số sai số tuyệt đối số với giá trị thực Ví dụ 2: Kết phân tích phương pháp chuẩn độ Complexon xác định hàm lượng CaO: 80,7%; MgO: 8,2% mẫu đá vôi Biết hàm lượng thực CaO: 80,5%; MgO: 8,0% δ ε hay δ ε μ x (1.2a) Phương pháp xác định oxit xác hơn? - dương hay âm - khơng có đơn vị đo - cho phép đánh giá độ xác phép đo Thơng thường sai số tương đối biểu diễn dạng phần trăm (%): δ 100.ε hay δ 100.ε μ x (1.2b) 13 14 1.4 Tổng thể mẫu 1.4 Tổng thể mẫu Mẫu (mẫu thống kê): số xác định quan sát thực nghiệm (hay kết phép đo mẫu phân tích riêng rẽ) gọi mẫu Ví dụ 3: Cần điều tra mức độ thiếu iot học sinh tiểu học thành phố A Tiến hành lấy mẫu nước tiểu học sinh số trường tiểu học thành phố để phân tích iơt Như nước tiểu số học sinh tiểu học trường lấy mẫu mẫu Mẫu tổng thể mẫu nước tiểu học sinh tiểu học thành phố A nói chung Tổng thể: tập hợp toàn mẫu (n , thơng thường n > 30) Trung bình mẫu (sampling fluctuation) (x ) giá trị trung bình mẫu giới hạn rút từ tập hợp số liệu Trung bình tổng thể (population average) (µ) giá trị trung bình tập hợp số liệu với n lớn (n ) Khi khơng có sai số hệ thống trung bình tổng thể giá trị thật phép đo Thông thường n > 30 xem x µ 15 16 1.5 Độ lặp lại độ 1.5 Độ lặp lại độ Ví dụ: Kết luận độ độ lặp lại với số liệu thực nghiệm biểu diễn hình sau: x Độ lặp lại (precision): dùng để mức độ gần giá trị riêng lẻ (xi) phép đo lặp lại / sai khác giá trị riêng lẻ so với giá trị trung bình ( x ) Độ (accuracy): độ gần giá trị phân tích (thường giá trị x ) với giá trị thực hay giá trị chấp nhận (A) (B) (C) (D) 17 18 1.5 Độ lặp lại độ 1.6 Chữ số có nghĩa cách lấy giá trị gần Độ lặp lại: Độ lặp (lại) (repeatatibility): tiến hành phương pháp phân tích, điều kiện thí nghiệm (người phân tích, trang thiết bị, PTN) khoảng thời gian ngắn Độ hồi phục (reproducibility): tiến hành phương pháp phân tích, điều kiện thí nghiệm khác khoảng thời gian dài - Độ lặp lại mô tả qua độ lệch chuẩn (S), phương sai (S2), Chữ số có nghĩa (CSCN): CSCN dãy số tất số chắn số khơng chắn Ví dụ 4: Thể tích dung dịch đọc buret (đối với loại 25-50 ml) lấy đến số thứ hai sau dấu phẩy, chẳng hạn 15,25 ml (tùy khoảng cách hai vạch chia thể tích giọt) (15,25: số có nghĩa, số chắn số cuối gần đúng, viết 0,01525 l) Chữ số có nghĩa qui ước sau: khoảng biến động Độ đúng: Độ biểu diễn dạng sai số tuyệt đối sai số tương đối Đánh giá độ phương pháp phân tích: dựa vào độ thu hồi phân tích mẫu thực tế thêm chuẩn, so sánh với 19 phương pháp chuẩn, phân tích mẫu CRM - Gồm chữ số tự nhiên 1, 2, …, - Số nằm số khác CSCN - Số nằm cuối dãy số CSCN đứng sau dấu phẩy - Số nằm bên trái chữ số khác khơng phải CSCN 20 1.6 Chữ số có nghĩa cách lấy giá trị gần Ví dụ 5: Giá trị 56,3 56,32 0,00247 85000 99 101 logex = 3,25 log10 = 56,32 Ký hiệu khoa học 5,63 x 101 5,632 x 101 2,47 x 10-3 8,5 x 104 9,9 x 101 1,01 x 102 - Số số có nghĩa 2 2 1.6 Chữ số có nghĩa cách lấy giá trị gần Độ bất ổn tuyệt đối 1/563 0,2 1/5632 0,02 1/247 0,4 1/85 1,2 1/99 1,0 1/101 1,0 - Khi lấy V=5,00 ml có nghĩa tính nồng độ phải lấy số có nghĩa (Có thể ghi giá trị nồng độ 0,0215 2,15.10-2 21,5.10-3 215.10-4 M) Nếu ghi thể tích bình V= 2,0 lit chuyển sang đơn vị ml ghi 2000 ml (vì ghi CSCN) mà phải ghi 2,0.103 ml Cách lấy giá trị gần đúng: Đại lượng đo trực tiếp: số cuối số gần số trước số cuối số Đại lượng đo gián tiếp: + Phép tính cộng trừ: số CSCN kết cuối lấy với số CSCN sau dấu phẩy số hạng có số CSCN sau dấu phẩy Ví dụ: 3,4 + 0,020 + 3,17 = 6,59 = 6,6 + Phép nhân chia: số CSCN kết cuối lấy số CSCN thừa số có số CSCN Ví dụ: 24 x 0,452/100,0 = 0,108 = 0,11 21 22 1.6 Chữ số có nghĩa cách lấy giá trị gần Bài tập + Những chữ số định nghĩa số đếm (người, vật ) luôn số xác nên xem có vơ số CSCN trình bày kết khơng dựa vào tốn có dạng y = a x; y = 10x; y = xa số CSCN y với số CSCN x Ví dụ: vật có khối lượng 0,2768 g Khối lượng vật: 0,2768 x = 2,229 g (vì theo định nghĩa 8,0000 ) Tương tự: (6,64 cm + 6,68 cm)/2 = 6,66 cm (2 2,000 ) + Phép tính logarit (hay antilogarit): lấy số CSCN sau dấu phẩy tổng số CSCN số ban đầu) Ví dụ: log(9,57.104) = 4,981 + Ký hiệu khoa học (với số hạng lớn bé): N x 10n Thực nghiệm thu kết sau: a Nồng độ thủy ngân (ppb) cật lợn là: 12,0 ; 12,1 ; 25,2 ; 8,4 ; 20,5 ; 21,0 b Hàm lượng SO2 (ppm) khơng khí là: 0,21 ; 0,18 ; 0,19 ; 0,24 c Mức oxy hòa tan (ppm) mẫu nước là: 8,1 ; 8,3 ; 7,9 ; 7,8 d Phần trăm (%) chlorua mẫu muối là: 55,13 ; 55,27 ; 55,09 ; 54,98 Biết hàm lượng thực kết là: a: 13,5; b: 0,13; c: 8,0; d: 56,00 Hãy cho biết kết mắc SSHT, SSNN ? 23 Có số có nghĩa số sau: a 47,351 b 0,0036 c 48000 d 48003 e 4,80 x 103 f log x = 6,132 g 20,00 h 6,02252 x 1023 Bài tập nhà: 1, (Miller [2], pp 16-17) 24 Chương THỐNG KÊ MÔ TẢ 2.1 Các đại lượng đặc trưng cho tâm tập số liệu thực nghiệm 2.2 Các đại lượng đặc trưng cho độ phân tán tập số liệu thực nghiệm 2.3 Sai số đại lượng đo gián tiếp 2.3.1 Sai số ngẫu nhiên đại lượng đo gián tiếp 2.3.2 Sai số hệ thống đại lượng đo gián tiếp Một tập số liệu thực nghiệm đặc trưng đại lượng: - Tâm tập số liệu thực nghiệm - Độ phân tán hay độ lặp lại tập số liệu thực nghiệm 25 26 2.1 Các đại lượng đặc trưng cho tâm tập SLTN 2.1 Các đại lượng đặc trưng cho tâm tập SLTN (1) Đại lượng trung bình Giả sử tiến hành n thí nghiệm lặp lại cho kết quả: x1, x2, ,xn Trung bình số học (mean, arithmetic mean): (2) Trung vị (median) Trung vị giá trị đứng hay giá trị trung tâm quan sát tập kết thực nghiệm x1, x2, …, xn xếp theo chiều tăng giảm dần Nếu n lẻ trung vị số dãy số Nếu n chẵn trung vị trung bình cộng giá trị nằm dãy số Ví dụ 2: Tính giá trị trung vị sinh viên A n x x x x x n n i 1 n i (2.1) Trung bình nhân (geometric mean): (2.2) n x hh n x1 x n n x i i 1 Trung bình bình phương (square mean): x sqm x x x n 2 2 n n xi Trung bình trung vị khơng cho ta nhìn tổng quát phân bố số trọng tập số liệu Muốn biết phân bố số tập số liệu phải xem xét đến độ phân tán (độ lệch khỏi giá trị trung bình) i 1 n (2.3) Ví dụ 1: tính đại lượng trung bình sinh viên A 27 28 2.2 Các đại lượng đặc trưng cho độ phân tán tập SLTN 2.2 Các đại lượng đặc trưng cho độ phân tán tập SLTN (1) Khoảng biến động R (range) Là hiệu số giá trị lớn (xmax) giá trị nhỏ (xmin) tập số liệu thí nghiệm: (2) Phương sai (2 hay s2) (variance) Là giá trị trung bình tổng bình phương độ lệch giá trị riêng lẻ xi giá trị thật µ hay giá trị trung bình x : Rx max x N (2.4) (x i ζ i 1 n s 2 (N > 30) (2.5) (n 30) (2.6) N Ví dụ 3: Tính R sinh viên B - R nhỏ độ lặp lại tốt - R phụ thuộc vào hai giá trị lớn nhỏ nên khơng phải đại lượng đặc trưng tốt cho độ phân tán tập kết thực nghiệm μ) (x i i 1 x) n -1 Giá trị (n - 1) = f gọi số bậc tự giá trị phương sai: Số bậc tự coi phép đo kiểm tra cần thiết để xác định kết phép đo 29 - Phương sai đại lượng đặc trưng tốt cho độ phân tán (lặp lại) - Phương sai có đơn vị khơng trùng với đại lượng đo 2.2 Các đại lượng đặc trưng cho độ phân tán tập SLTN 2.2 Các đại lượng đặc trưng cho độ phân tán tập SLTN Ví dụ 4: Tính phương sai sinh viên A (3) Độ lệch chuẩn ( hay s) (standard deviation) N Tổng xi (xi-x) (xi-x)2 10,08 -0.02 0.0004 10,11 0.01 0.0001 10,09 -0.01 0.0001 10,10 0.00 0.0000 10,12 0.02 0.0004 50.50 0.0010 S 50,50 x i 1 10,1 ml n s i 1 n -1 0,001 0,0003 μ) N (x i i 1 x) n -1 hay ζ ζ 2 hay S S (N > 30) (2.7) (n 30) (2.8) - Giá trị độ lệch chuẩn đặc trưng tốt cho độ lặp lại dãy kết thực nghiệm - Đơn vị giá trị độ lệch chuẩn trùng với đơn vị đại lượng đo thuận lợi cho việc thông báo kết ( x S) n n i 1 n xi (x i x ) (x i ζ 30 31 32 2.2 Các đại lượng đặc trưng cho độ phân tán tập SLTN 2.2 Các đại lượng đặc trưng cho độ phân tán tập SLTN (4) Sai số chuẩn - SE (standard error) (5) Độ lệch chuẩn tương đối - RSD (relative standard deviation) hệ số biến động - CV (Coefficient of variation) SE ζ S hay SE N n (2.9) RSD(%) Sai số chuẩn đặc trưng cho độ bất ổn giá trị trung bình độ lệch chuẩn độ lệch phép đo riêng lẻ 100 ζ 100 S hay RSD (%) μ x (2.10) - Đại lượng RSD (hay gọi CV) dùng để đánh giá SSNN giá trị trung bình độ lặp lại tập SLTN - RSD cho phép so sánh sai số kết thực nghiệm Ví dụ 5: phân tích đồng chì nước thu kết quả: Cu: 1,0 0,2 (ppb); Pb: 5,0 0,5 (ppb) Phương pháp phân tích lim loại xác (ít mắc sai số) hơn? 33 2.2 Các đại lượng đặc trưng cho độ phân tán tập SLTN 2.2 Các đại lượng đặc trưng cho độ phân tán tập SLTN Trong phân tích, RSD kết phân tích chấp nhận được? dựa vào hàm Horwitz: RSDH (%) = 2(1 – 0,5.logC) 34 (2.11) Trong nội PTN: RSD ½ RSDH độ lặp lại đạt yêu cầu Liên PTN: RSD RSDH độ lặp lại đạt yêu cầu Ví dụ 6: C: nồng độ phân số (ví dụ ppm C = 1/106) Tính RSDH ppb, ppm? Kết phân tích lặp lại Pb mẫu nước thu kết sau: 1,2; 1,8; 1,6; 2,1 1,7 ppb Đánh giá độ lặp lại phương pháp phân tích? Horwitz trumpet (1982) 35 36 2.2 Các đại lượng đặc trưng cho độ phân tán tập SLTN 2.3 Sai số đại lượng đo gián tiếp (6) Độ lệch - Sk (skewness) Sk dùng để tính bất đối xứng tần suất xuất số liệu tập SLTN - Sk = 0: phân bố đối xứng - Sk < 0: đỉnh đường cong lệch phải so với giá trị trung bình - Sk > 0: đỉnh đường cong lệch trái so với giá trị trung bình (7) Độ nhọn - Ku (kurtosis) - Ku = 0: phân bố thực nghiệm tiệm cận chuẩn - Ku < 0: đỉnh đường cong nhọn phân bố chuẩn - Ku > 0: đỉnh đường cong bẹt so với phân bố chuẩn Biểu diễn số liệu thực nghiệm: x S (n ?) t.S x (n ?) n Nhiều kết thực nghiệm tính tốn từ hay nhiều phép đo trực tiếp: y = f(x1, x2,…, xn) Y: đại lượng đo gián tiếp, x: đại lượng đo trực tiếp Mỗi phép đo trực tiếp có độ lệch chuẩn riêng sai số kết cuối cùng? tính tốn sai số đại lượng đo gián tiếp dựa vào Quy luật lan truyền sai số Sai số phép đo = SSNN + SSHT 37 38 2.3 Sai số ngẫu nhiên đại lượng đo gián tiếp 2.3 Sai số ngẫu nhiên đại lượng đo gián tiếp Đại lượng xác định gián tiếp y hàm đại lượng đo trực tiếp x1, x2,…, xn: y = f(x1, x2,…, xn) Phương sai y: Hàm có dạng tổng hiệu: y = ko k1.x1 k2.x2 … S2y (k1.Sx1 ) (k Sx ) S y (k1.Sx1 ) (k Sx ) n y y y 2 y 2 S2y ( ) S2x1 ( ) Sx ( ) Sx n ( ) S2x i i 1 x i x1 x x n y : đạo hàm riêng y theo xi x i S2x i : phương sai đại lượng đo trực tiếp xi Độ lệch chuẩn y: Sy n ( i 1 y 2 ) Sx i x i (2.13) Ví dụ 7: Tính sai số phép cân: Cốc cân: m0 (g) Cốc cân + vật cân: m1 (g) Độ xác cân: 0,0001 (g) Tính sai số phép đo thể tích: Mẫu trắng: V0 (ml) Mẫu thực tế: V1 (ml) Độ xác buret: 0,05 (ml) (2.12) 39 40 4.2 Kiểm tra số liệu thực nghiệm 4.2 Kiểm tra số liệu thực nghiệm Ví dụ 4: Kết xác định nồng độ nitrat (ppm) mẫu nước sông sau: 0,403; 0,410; 0,401; 0,380 Giá trị 0,380 có mắc sai số thơ khơng? Bài tốn 2: So sánh độ lặp lại tập số liệu Có tập số liệu: Tập số liệu 1: n1, x1 , S12 Tập số liệu 2: n2, x , S22 Vấn đề: S12 S22 khác hay không khác nhau? Áp dụng chuẩn Fisher (F) Phạm vi áp dụng: So sánh độ lặp lại PTN / phương pháp / thiết bị / người đo… So sánh tập số liệu có phân bố không? Nghiên cứu yếu tố ảnh hưởng điều kiện thí nghiệm (T, P, ) đến độ lặp lại tín hiệu đo… 77 78 4.2 Kiểm tra số liệu thực nghiệm 4.2 Kiểm tra số liệu thực nghiệm Nguyên tắc: Ví dụ 5: Kiểm tra độ lặp lại phương pháp xác định COD (mg/l) mẫu nước thải: Phương pháp chuẩn: x = 72, S = 3,31 (n = 8) Phương pháp : x = 72, S = 1,51 (n = 8) Độ lặp lại phương pháp có tốt phương pháp chuẩn khơng ? Tính giá trị FTN: F TN s2 = 12 s2 (4.4) Tra FLT (P = 0,95, f1 = n1 – 1, f2 = n2 – 1) Ho: S12 S22 FTN < FLT: S12 S22 FTN > FLT: S12 S22 Lưu ý: - Nếu cần kiểm tra dãy thí nghiệm có lặp lại dãy thí nghiệm khơng kiểm tra phía (tra FLT phía) - Nếu cần kiểm tra độ lặp lại dãy thí nghiệm có khác khơng kiểm tra phía (tra FLT phía) 79 80 4.2 Kiểm tra số liệu thực nghiệm 4.2 Kiểm tra số liệu thực nghiệm Ví dụ 6: Kết xác định B (mg/kg) mẫu thực vật: Phương pháp trắc quang : x = 28,0, S = 0,3 (n = 10) Phương pháp huỳnh quang: x = 26,25, S = 0,23 (n = 10) So sánh độ lặp lại phương pháp ? Bài toán 3: So sánh giá trị trung bình giá trị thực Phạm vi áp dụng: - Kiểm tra phương pháp đo: x (CRMs/mẫu chuẩn) - Kiểm tra thiết bị đo/phòng thí nghiệm/người phân tích… - Nghiên cứu ảnh hưởng (nhiệt độ, áp suất…) Nguyên tắc: - Tính: t TN | x -μ | n S (4.5) - Tra = 0,95, f = n – 1) - Ho: x tTN < tLT chấp nhận Ho: x hay x không mắc SSHT tTN > tLT loại bỏ Ho: x hay x mắc SSHT tLT(P 81 82 4.2 Kiểm tra số liệu thực nghiệm 4.2 Kiểm tra số liệu thực nghiệm Ví dụ Khi phân tích thủy ngân mẫu CRM phương pháp AAS kết hợp bay lạnh thu kết quả: 38,9%; 37,4%; 37,1% Phương pháp có mắc SSHT khơng? (Hg = 38,9%) Bài tốn 4: So sánh giá trị trung bình Có tập số liệu: Tập số liệu 1: n1, x1 , S12 Tập số liệu 2: n2, x , S22 Vấn đề: x1 x khác hay không khác nhau? Áp dụng chuẩn Student (t) Phạm vi áp dụng: So sánh kết đo PTN / phương pháp / thiết bị / người đo… Nghiên cứu yếu tố ảnh hưởng điều kiện thí nghiệm (T, P, ) đến kết đo… 83 84 4.2 Kiểm tra số liệu thực nghiệm 4.2 Kiểm tra số liệu thực nghiệm Nguyên tắc: Tra tLT + Trường hợp 1: tLT (P = 0,95, f = n1 + n2 – 2) + Trường hợp 2: tLT (P = 0,95, f) Ho: x1 x tTN < tLT chấp nhận Ho: x1 x So sánh giá trị phương sai (S12 S22) dùng chuẩn F: Trường hợp 1: S12 S22 t TN | x1 - x | n1.n2 (n1 1).S12 (n2 1).S22 (4.6) với S S n1 n2 n1 n2 Trường hợp 2: t TN S12 S22 | x1 - x | S12 /n1 S22 /n2 tTN > tLT loại bỏ Ho: x1 x 2 S1 S2 n (4.7) với n f 12 - 2 S1 S22 n1 n2 n1 n2 85 86 4.2 Kiểm tra số liệu thực nghiệm 4.2 Kiểm tra số liệu thực nghiệm Ví dụ Kết xác định nồng độ thiol máu nhóm người: Bài tốn 5: Kiểm định cặp (paired t-test) Nhóm đối chứng 1.84 1.92 1.94 1.92 1.85 1.91 Nhóm nghi vấn 2.81 4.06 3.62 3.27 3.27 3.76 2.07 Đo đại lượng nhiều mẫu phương pháp khác (phương pháp chuẩn phương pháp mới) Kết quả: Nồng độ thiol nhóm nghi vấn có khác nhóm đối chứng? Mẫu … n Phương pháp chuẩn x1 x2 … xn Phương pháp y1 y2 … yn Vấn đề: kết phương pháp có khác khơng? (hay phương pháp có mắc sai số hệ thống không?) 87 88 4.2 Kiểm tra số liệu thực nghiệm 4.2 Kiểm tra số liệu thực nghiệm Nguyên tắc: Ví dụ Xác định nồng độ chì phương pháp xử lý mẫu khác nhau: - Tính di: di = xi – yi (hay yi – xi) d1 d2 … dn di - d n (d d)2 - Sd i n 1 Mẫu Phương pháp oxi hóa ướt 71 61 50 60 Phương pháp chiết 76 68 48 57 Kết phương pháp có khác khơng? | d| n (4.8) Sd - Tra tLT(P = 0,95, f = n – 1) - Ho: d (d = 0) tTN < tLT: kết đo phương pháp không khác tTN > tLT: kết đo phương pháp khác TN - t 89 90 4.2 Kiểm tra số liệu thực nghiệm 4.2 Kiểm tra số liệu thực nghiệm Ví dụ 10 Kết xác định sông 02 cán bộ: So sánh độ lặp lại cán bộ: NO3- (mg/l) mẫu nước Cán 0.60 0.74 0.72 0.85 0.76 0.72 0.78 0.60 Cán 0.72 0.75 0.55 0.67 1.06 0.51 0.70 0.72 So sánh độ lặp lại 02 cán ? Kết phân tích cán giống hay khác ? (Giải tốn sử dụng cơng cụ Excel) Dãy sơ liệu có phương sai lớn (Cán 2) Bài tập: 2, 4, 6, 12, 13 (Miller [2], trang 69 – 72) 91 92 4.2 Kiểm tra số liệu thực nghiệm 4.2 Kiểm tra số liệu thực nghiệm So sánh độ lặp lại cán bộ: So giá trị trung bình cán bộ: FTN = 5,55 FLT (0.95, 6,6) = 5,82 (tra F phía) FTN < FLT Kết luận: Ở mức ý nghĩa 0,05, độ lặp lại cán 93 94 4.2 Kiểm tra số liệu thực nghiệm 4.2 Kiểm tra số liệu thực nghiệm So giá trị trung bình cán bộ: Ví dụ 11 Kết DO (mg/l) 14 phòng thí nghiệm phương pháp khác nhau: PTN Winkler 10 11 12 13 14 1.2 1.4 1.4 1.3 1.2 1.3 1.4 2.0 1.9 1.1 1.8 1.0 1.1 1.4 Điện cực 1.6 1.4 1.9 2.3 1.7 1.3 2.2 1.4 1.3 1.7 1.9 1.8 1.8 1.8 tTN = 0,41 tLT (0.95, 12) = 2,18 tTN < tLT Kết đo DO phương pháp có khác khơng? (Giải tốn sử dụng cơng cụ Excel) Kết luận: Ở mức ý nghĩa 0,05, kết phân tích cán (hay khác khơng có ý nghĩa) mặt thống kê 95 96 4.2 Kiểm tra số liệu thực nghiệm 4.2 Kiểm tra số liệu thực nghiệm tTN = 2,5 tLT (0.95, 13) = 2,2 tTN > tLT Kết luận: Ở mức ý nghĩa 0,05, kết DO đo phương pháp khác khác có ý nghĩa mặt thống kê 97 98 Chƣơng TƢƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH 5.1 Đại cƣơng 5.1 Đại cương 5.2 Tương quan 5.3 Hồi quy tuyến tính Trong nghiên cứu hóa học, giả sử thu kết quả: - Tập kết thí nghiệm thứ nhất: x1 ; x2 ; , xn (ký hiệu xi, i: n) - Tập kết thí nghiệm thứ hai: y1 ; y2 ; , yn (ký hiệu yi, i: n) Vấn đề đặt ra: Giữa xi yi có mối quan hệ khơng ? Dạng đường quan hệ xi yi ? (tuyến tính hay phi tuyến…) Nếu quan hệ gữa xi yi tuyến tính (y = a + b x) đường thẳng hay phương trình tốt ? Việc xác định hệ số r; a b; Sa Sb; a b ? Phân tích Tương quan (correlation) Hồi quy (Regression) 99 100 5.1 Đại cƣơng 5.2 Tƣơng quan (Correlation) Ví dụ 1: Định lượng phương pháp phân tích cơng cụ: Có đại lượng y x: y: tín hiệu định lượng, hiệu suất phản ứng,… Pha dãy dung dịch chuẩn nồng độ: x1; x2; , xn x: nồng độ, yếu tố ảnh hưởng (nhiệt độ, áp suất…) (x biến độc lập) Đo tín hiệu chất phân tích: Vấn đề: y x có tương quan tuyến tính y = a + bx ? y1; y2; , yn Phân tích tương quan: (y biến phụ thuộc) Thực thí nghiệm: (x1, y1), (x2, y2), …, (xn, yn) Tín hiệu chất phân tích đo từ mẫu: ym Tính hệ số tương quan x y: Vấn đề đặt ra: r Dạng đường chuẩn hệ số tương quan r ? Nếu y = a + b x đường thẳng / phương trình tốt ? Sai số a (Sa) b (Sb) biên giới tin cậy a b ? (xi x )(yi y ) (xi x ) (yi y ) 2 n x i y i x i y i (n xi ( xi )2 ) (n yi ( yi )2 ) 2 (5.1) r : [-1, +1] (-1 r +1) Giới hạn phát (LOD) phương pháp ? 101 5.2 Tƣơng quan (Correlation) 102 5.2 Tƣơng quan (Correlation) r = 0: x y tương quan (tuyến tính) r < 0: x y có quan hệ nghịch biến (x tăng y giảm) r > 0: x y có quan hệ đồng biến (x tăng y tăng) r : cho biết mối quan hệ tương quan x y (r 1: tương quan chặt chẽ) Giữa x y có Tương quan tuyến tính r = ? So sánh rTN với rLT (P = 0,95, f = n-2) rTN > rLT: tương quan tuyến tính Ví dụ 2: Kết đo cường độ huỳnh quang dãy dung dịch chuẩn Fluorescein (Miller, 2005): Xác định hệ số tương quan r ? Giữa nồng độ Fluorescein tín hiệu cường độ huỳnh quang có tương quan không P = 0,95 ? (Phương pháp phân tích cơng cụ r 0,99) 103 104 5.2 Tƣơng quan (Correlation) 5.2 Tƣơng quan (Correlation) Lập bảng tính: Sử dụng phần mềm Excel: Data Data analysis Correlation: rLT (0,95, 5) = 0,75 rTN > rLT nồng độ tín hiệu có tương quan chặt chẽ 105 106 5.2 Tƣơng quan (Correlation) 5.3 Hồi quy tuyến tính (Linear regression) r 0: khơng có tương quan tuyến tính, có TQ phi tuyến Có tập số liệu thực nghiệm (SLTN) Tập SLTN thứ 1: x1 ; x2 ; , xn (x biến độc lập) Tập SLTN thứ 2: y1 ; y2 ; , yn (y biến phụ thuộc) r 1: có tương quan tuyến tính, có TQ phi tuyến x y có thực tương quan tuyến tính kiểm tra chuẩn t: Tính: t TN r n (5.2) 1 r2 Tra tLT (P, f = n-2) Ho: không tương quan tuyến tính tTN < tLT: khơng có tương quan tuyến tính (chấp nhận Ho) tTN > tLT: có tương quan tuyến tính (bác bỏ Ho) (Nếu biết chắn có tương quan tuyến tính khơng cần xét t, chẳng hạn x y đường chuẩn) 107 Vẽ đường hồi quy (đường tốt qua điểm) từ cặp số liệu (xi, yi) (Đường tốt đường có 2 (yi y) bé nhất) Phương trình hồi quy có dạng: y = a + bx a: hệ số chắn (đoạn cắt trục tung) b: hệ số góc (độ dốc) 108 5.3 Hồi quy tuyến tính (Linear regression) 5.3 Hồi quy tuyến tính (Linear regression) Xác định hệ số a, b phương trình hồi quy: Xác định độ lệch chuẩn a (Sa) b (Sb): 2 Tìm a b để Q = (yi y) nhỏ áp dụng phương pháp bình phương tối thiểu (Method of least square): Q 0 a Q 0 b y x a y b x i b i n n n xi yi xi yi ( xi x )( yi y ) b n xi2 ( xi )2 ( xi x ) a, b đại lượng đo gián tiếp (phụ thuộc vào yi) 2 b a Sb2 S yi Sa2 S yi yi yi Chấp nhận S2y1 S2y2 S2yn S2y (yi mắc sai số xi) Sb S y (5.3) Sy n n xi2 ( xi )2 ( xi x ) xi Sa S y n xi ( xi )2 (5.4) Sy Sy (5.5) xi (5.6) n ( xi x )2 y)2 (Sy: sai số chuẩn y) n2 (yi (5.7) 109 110 5.3 Hồi quy tuyến tính (Linear regression) 5.3 Hồi quy tuyến tính (Linear regression) Xác định biên giới tin cậy a (a) b (b): Ví dụ 3: Xác định phương trình hồi quy từ Ví dụ a tSa b tSb với t(P = 0,95, f = n -2) với t(P = 0,95, f = n -2) Tổng (5.8) (5.9) xi 10 12 42 yi 2,1 5,0 9,0 12,6 17,3 21,0 24,7 91,7 364 x2i Phương trình hồi quy: y (a a ) (b b )x 16 36 64 100 144 xi x -6 -4 -2 ( xi x )2 36 16 4 16 36 112 yi y -11,0 -8.1 -4.1 -0,5 4,2 7,9 11,6 ( xi x )( yi y ) yi yi - yi yi - y i 2 66,0 32,4 8,2 8,4 31,6 69,6 216,2 1,52 5,38 9,24 13,10 16,96 21,82 24,68 0,58 364 0,24 0,5 0,34 0,18 0,02 0,3364 0,1444 0,0576 0,2500 0,1156 0,0324 0,0004 0,9368 x 6,0, y 13,1 111 112 5.3 Hồi quy tuyến tính (Linear regression) b ( xi x )( yi y ) ( xi x )2 5.3 Hồi quy tuyến tính (Linear regression) Sử dụng phần mềm Excel: Data Data analysis Regression: 216,2 1,93 a y b x 13,1 1,93 x6 1,52 112 y = 1,52 + 1,93x Sy Sb 2 (yi y) n2 0,9368 0,4329 Sy 0,4329 0,0409 112 ( xi x ) Sa S y xi n ( xi x )2 0,4329 364 0,2950 x112 a tSa 2,57 x0,2950 0,76 b tSb 2,57 x0,4329 0,11 y (a a ) (b b ) x (1,52 0,76) (1,93 0,11) x Bài tập: 2, 3, (Miller [2], trang 151-153) 113 114 5.3 Hồi quy tuyến tính (Linear regression) 5.3 Hồi quy tuyến tính (Linear regression) Sử dụng phần mềm Excel: Data Data analysis Regression: Giới hạn phát hiện, LOD (Limit of Detection): nồng độ nhỏ chất phân tích phát (định tính) cách tin cậy phương pháp Giới hạn định lượng, LOQ (Limit of Quantitation): nồng độ nhỏ đo (định lượng) xác (đúng lặp lại) phương pháp r Sy Xác định LOD LOQ từ phương trình hồi quy: LOD = yB + 3SB; LOQ = yB + 10SB yB: tín hiệu mẫu trắng, SB: độ lệch chuẩn mẫu trắng a b Sa LOD 3S y LOQ 10S y b b (5.10) (5.11) Sb 115 116 5.3 Hồi quy tuyến tính (Linear regression) Chƣơng KẾ HOẠCH HĨA THÍ NGHIỆM Ví dụ 4: Xác định LOD LOQ từ Ví dụ 6.1 Đại cương 6.2 Quy hoạch hóa thí nghiệm 6.3 Mơ hình hóa thí nghiệm 6.4 Tối ưu hóa thí nghiệm 117 118 6.1 Đại cƣơng 6.2 Quy hoạch hóa thí nghiệm Kế hoạch hóa thực nghiệm bao gồm nhiệm vụ chính: Kết thí nghiệm phụ thuộc điều kiện / yếu tố thí nghiệm: Yếu tố cố định: phương pháp, pH, nhiệt độ, áp suất, nồng độ… khác Yếu tố ngẫu nhiên: mẫu khác nhau, thời gian thí nghiệm khác nhau, thời gian bảo quản mẫu… Vấn đề: ảnh hưởng yếu tố / điều kiện thí nghiệm đến kết thí nghiệm ? Phương pháp ANOVA cho phép đánh giá: Ước lượng phương sai yếu tố thí nghiệm kết thí nghiệm ảnh hưởng yếu tố khảo sát (cố định ngẫu nhiên) Các nguồn phương sai có ảnh hưởng đến kết (thí nghiệm) trung bình khơng ? Sai số thân phương pháp đo (sai số thí nghiệm) – Qui hoạch hóa thực nghiệm: Tiến hành thí nghiệm theo qui hoạch định trước để đánh giá ảnh hưởng yếu tố khảo sát lên kết thí nghiệm → Phân tích phương sai - ANOVA (one-way ANOVA two-way ANOVA) – Mô hình hóa thực nghiệm: Mơ hình hóa ảnh hưởng điều kiện thí nghiệm đến kết thí nghiệm biểu diễn mơ hình hàm số / phương trình tốn học y = f(x1, x2, …, xn) y: đại lượng đo, xi: điều kiện thí nghiệm – Tối ưu hóa thực nghiệm: Tìm điều kiện tối ưu để thu kết thí nghiệm tốt 119 120 6.2 Quy hoạch hóa thí nghiệm Phân tích phƣơng sai yếu tố Trường hợp 1: đánh giá ảnh hưởng yếu tố thí nghiệm đến kết thí nghiệm nguồn phương sai (sai số): phương sai yếu tố thí nghiệm phương sai thí nghiệm (phương sai đo) Bố trí (quy hoạch) thí nghiệm theo ANOVA yếu tố: Các mức yếu tố n … j n Áp dụng phân tích phương sai yếu tố (one-way ANOVA) Trường hợp 2: đánh giá ảnh hưởng yếu tố thí nghiệm (1 yếu tố cố định yếu tố ngẫu nhiên) đến kết thí nghiệm nguồn phương sai (sai số): phương sai yếu tố thí nghiệm phương sai thí nghiệm (phương sai đo) Áp dụng phân tích phương sai yếu tố (two-way ANOVA) Trường hợp 3: đánh giá ảnh hưởng yếu tố thí nghiệm nguồn phương sai (sai số) Áp dụng kỹ thuật đánh giá ô vuông La tinh kết hợp với ANOVA … i … k x1,1 x1,2 x1,j … x1,n x2,1 x2,2 … x2,j x2,n … … … … xi,1 xi,2 xi,j xi,n … … … … … xk,1 xk,2 … xk,j … xk,n x1 x2 … xi … xk Trung bình x Yếu tố: pH/ nhiệt độ/ nồng độ/ áp suất,…; mẫu/ người/ PTN… 121 Phân tích phƣơng sai yếu tố Phân tích phƣơng sai yếu tố Đánh giá theo ANOVA yếu tố: Giả thiết H0: kết thí nghiệm mức khác yếu tố khảo sát thuộc phân bố chuẩn có giá trị trung bình phương sai 02 H0 : x1 x x k σo2 ước lượng từ nguồn phương sai / biến động: S2TN i n 1 ( xij xi ) i j FTN S2A S2TN (6.3) Tra: FLT (P , f k 1, f k (n 1)) FTN < FLT: SA2 STN2 x i không khác FTN > FLT: SA2 STN2 x i khác (6.1) k (n 1) (2) Phương sai mức (SA2): n ( x i x ) S2A i k 1 Tính: (Các mức yếu tố khảo sát không ảnh hưởng đến KQTN) (1) Phương sai nội mức (S2TN ): Si 122 (Các mức yếu tố khảo sát có ảnh hưởng đến KQTN) Các x i khác nhau: giá trị x i khác giá trị x i lại nhóm giá trị x i khác giá trị x i khác … (6.2) 123 124 Phân tích phƣơng sai yếu tố Phân tích phƣơng sai yếu tố So sánh giá trị xi : Tính tốn theo ANOVA yếu tố: Tính giá trị trung bình x i x Tính tổng bình phương: ( xij xi ) Sắp xếp giá trị x i tăng dần Tính “Độ lệch nhỏ nhất” (min): t k (n1)STN i n j ( xij x) = ( xij xi ) + n ( xi x) i i ( xij x ) So sánh min với độ lệch giá trị trung bình gần (): i 2 n ( xi x)2 (6.4) i j j i j Tính phương sai: xi xi1 > min: xi xi1 S2A < min: xi xi1 n ( x i x ) S2 i k 1 ( xij x ) i S2TN ( xij xi ) i j k (n 1) j k.n 125 126 Phân tích phƣơng sai yếu tố Phân tích phƣơng sai yếu tố Lập bảng phân tích phương sai: Ví dụ: Độ ổn định dung dịch điều kiện bảo quản khác đánh giá qua tín hiệu huỳnh quang: Nguồn phương sai Tổng bình phương Giữa mức n ( xi x) Bậc tự Phương sai k–1 SA2 i Trong nội mức ( xij xi ) i Tổng cộng k (n – 1) STN2 n.k – S2 A – Vừa pha B – Giữ bóng tối j ( xij x) i Điều kiện C – Giữ 1h ánh sáng mờ D – Giữ 1h chỗ sáng j Tính FTN tra FLT Đánh giá kết Kết đo lặp lại 102; 100; 101 101; 101; 104 97; 95; 99 90; 92; 94 Điều kiện bảo quản khác ảnh hưởng đến độ ổn định dung dịch ? 127 128 Phân tích phƣơng sai yếu tố Phân tích phƣơng sai yếu tố Tính giá trị trung bình: Tính phương sai: x A 101 x C 97 xB 102 xD 92 S2A x 98 n ( x i x ) S2TN Tính tổng bình phương: n ( xi x)2 i ( xij xi ) i S j i k 1 ( xij xi ) i j k (n 1) ( xij x ) i j k.n ( xij x ) i j 129 130 Phân tích phƣơng sai yếu tố Phân tích phƣơng sai yếu tố Lập bảng phương sai: So sánh giá trị x i : Nguồn phương sai Giữa mức Tổng bình phương n ( xi x) i Trong nội mức ( xij xi ) Tổng cộng ( xij x) i i j j Bậc tự Phương sai k–1 SA2 k (n – 1) STN2 n.k – S2 Tính “Độ lệch nhỏ nhất” (min): t k (n1)STN n So sánh giá trị trung bình: Tính FTN tra FLT: Đánh giá kết quả: Bài tập: 11 (Miller [2[, trang 72) 131 132 Phân tích phƣơng sai yếu tố Phân tích phƣơng sai yếu tố Sử dụng Excel: Data Data analysis Anova: Single factor 133 6.3 & 6.4 Mơ hình hóa tối ƣu hóa thí nghiệm Xem chương đến chương 12 (Lê Đức Ngọc [1]) Xem Chapter (Miller, [2]) 135 134 ... lượng trung bình Giả sử tiến hành n thí nghiệm lặp lại cho kết quả: x1, x2, ,xn Trung bình số học (mean, arithmetic mean): (2) Trung vị (median) Trung vị giá trị đứng hay giá trị trung tâm... Nếu n lẻ trung vị số dãy số Nếu n chẵn trung vị trung bình cộng giá trị nằm dãy số Ví dụ 2: Tính giá trị trung vị sinh viên A n x x x x x n n i 1 n i (2.1) Trung bình nhân... Cách biểu diễn sai số Ví dụ 1: Bốn sinh viên A, B, C D tiến hành chuẩn độ 10 ml dung dịch chuẩn NaOH 0,100 M dung dịch chuẩn HCl 0,100 M, sinh viên chuẩn độ lặp lại lần cho kết sau: (1) Sai số