TS LÊ ĐÌNH VŨ GIÁO TRÌNH XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC NHÀ XUẤT BẢN ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH Lời nói đầu LỜI NÓI ĐẦU Trong nghiên cứu thực nghiệm nói chung và lĩnh vực Hóa học nói riêng, thí nghiệm cần được thiết kế, phân tích và đánh giá thông qua các phép tính toán thống kê nhằm bảo đảm tính khoa học và độ tin cậy của kết quả Vì vậy, xử lý số liệu và quy hoạch thực nghiệm là nội dung quan trọng của ngành Hóa phân tích và Công nghệ hóa học Nội dung giáo trình “.
TS LÊ ĐÌNH VŨ GIÁO TRÌNH XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC NHÀ XUẤT BẢN ĐẠI HỌC CƠNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH Lời nói đầu LỜI NĨI ĐẦU Trong nghiên cứu thực nghiệm nói chung lĩnh vực Hóa học nói riêng, thí nghiệm cần thiết kế, phân tích đánh giá thơng qua phép tính tốn thống kê nhằm bảo đảm tính khoa học độ tin cậy kết Vì vậy, xử lý số liệu quy hoạch thực nghiệm nội dung quan trọng ngành Hóa phân tích Cơng nghệ hóa học Nội dung giáo trình “Xử lý số liệu Quy hoạch thực nghiệm Hóa học” tập trung vào việc vận dụng lý thuyết xác suất thống kê để giải vấn đề thực tế Hóa phân tích Cơng nghệ Hóa học Giáo trình gồm 06 chương: Chương Đại lượng đặc trưng tập số liệu thực nghiệm; Chương Hàm phân phối xác suất chuẩn thống kê Hai chương đầu giáo trình kiến thức sở liên quan đến lý thuyết thống kê đặc trưng tập số liệu thực nghiệm Những tập thực tế vận dụng để tính tốn, mơ tả thống kê đặc trưng nhiều tập số liệu thực nghiệm Chương Kiểm định thống kê ứng dụng; Chương Xử lý thống kê thẩm định phương pháp phân tích Chương chương trình bày việc ứng dụng cơng cụ xác suất thống kê Hóa phân tích như: đánh giá phương pháp phân tích, đánh giá thiết bị phân tích, thử nghiệm thành thạo, thẩm định phương pháp vấn đề khác liên quan đến đảm bảo chất lượng hoạt động kiểm nghiệm Chương Phân tích tác động yếu tố tới kết thực nghiệm; Chương Thiết kế phân tích thực nghiệm Hai chương cuối gồm nội dung liên quan đến thiết kế phân tích thực nghiệm Phần trình bày chi tiết từ sở lý thuyết tới ứng dụng toán học hồi quy thiết kế thực nghiệm với mơ hình khác nhau; ứng dụng lý thuyết thống kê đánh giá kết mơ hình; tối ưu XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HĨA HỌC hóa mơ hình để xác định giá trị thông số đáp ứng với yêu cầu đặt cho toán thực nghiệm Giáo trình biên soạn với ví dụ thực tế, cập nhật lĩnh vực Hóa phân tích Cơng nghệ hóa học Xun suốt nội dung giáo trình, hai phần mềm Microsoft Excel Statgraphics sử dụng để mô tả thống kê, kiểm định thống kê tập số liệu thực nghiệm; thiết kế, phân tích tối ưu hóa thực nghiệm Giáo trình tài liệu học tập cho học viên cao học ngành Hóa phân tích Cơng nghệ hóa học Ngồi ra, giáo trình cịn dùng làm tài liệu tham khảo cho bậc đại học ứng dụng xử lý số liệu, thiết kế phân tích thực nghiệm để thực đề tài nghiên cứu khóa luận tốt nghiệp Mặc dù nội dung biên soạn cẩn thận, song khó tránh khỏi thiếu sót, tác giả mong bạn đọc góp ý để giáo trình hồn thiện lần tái sau Thư góp ý xin gửi địa email: ledinhvu@iuh.edu.vn Trân trọng cảm ơn Mục lục MỤC LỤC Trang Chương 1: Đại lượng đặc trưng tập số liệu thực nghiệm 1.1 Đại lượng đặc trưng cho tâm phân bố vị trí tập số liệu 1.2 Đại lượng đặc trưng cho phân tán tập số liệu thực nghiệm 1.2.1 Phương sai 1.2.2 Độ lệch chuẩn 1.2.3 Độ sai chuẩn/độ lệch chuẩn trung bình 1.2.4 Khoảng biến thiên 1.2.5 Độ lệch chuẩn tương đối/hệ số biến sai 1.3 Sai số đo lường 1.3.1 Sai số tuyệt đối 1.3.2 Sai số tương đối 1.3.3 Sai số hệ thống 1.3.4 Sai số ngẫu nhiên 1.4 Ứng dụng Excel tính tốn đại lượng đặc trưng tập số liệu thực nghiệm 10 1.4.1 Ứng dụng hàm Excel tính thơng số tập số liệu 10 1.4.2 Công cụ Excel mô tả tập số liệu thực nghiệm 13 Bài tập chương 1: 16 Tài liệu tham khảo 17 Chương 2: Hàm phân phối xác suất chuẩn thống kê 18 2.1 Phân phối xác suất Gauss chuẩn Z 18 2.1.1 Cơ sở thống kê ứng dụng phân phối Gauss 18 2.1.2 Tính tốn phân phối Gauss hàm Excel 20 2.2 Phân phối Student chuẩn t 23 2.2.1 Cơ sở thống kê ứng dụng phân phối Student 23 2.2.2 Hàm Excel tính toán phân phối Student 25 2.3 Phân phối Fisher chuẩn F 27 2.3.1 Cơ sở thống kê ứng dụng phân phối Fisher 27 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC 2.3.2 Tính tốn phân phối Fisher hàm Excel 29 2.4 Phân phối Chi bình phương chuẩn χ2 30 2.4.1 Cơ sở thống kê ứng dụng phân phối Chi bình phương 30 2.4.2 Tính tốn phân phối Chi bình phương hàm Excel 32 2.5 Phân phối Tam giác cân 32 2.6 Phân phối Hình chữ nhật 34 Bài tập chương 2: 36 Tài liệu tham khảo 37 Chương 3: Kiểm định thống kê ứng dụng 38 3.1 Giả thuyết thống kê kết luận thống kê 38 3.1.1 Giả thuyết thống kê 38 3.1.2 Kết luận thống kê 38 3.1.3 Mối quan hệ chuẩn thống kê kết luận thống kê 40 3.2 Kiểm định Student ứng dụng 41 3.2.1 Kiểm định Student so sánh giá trị trung bình tập số liệu với giá trị cho trước 42 3.2.2 Kiểm định Student liên quan đôi 46 3.2.3 Kiểm định Student cho hai mẫu có phương sai đồng 51 3.2.4 Kiểm định Student cho hai mẫu không đồng phương sai 54 3.3 Kiểm định Gauss ứng dụng 57 3.3.1 Kiểm định Z cho tập mẫu 57 3.3.2 Kiểm định Z cho hai tập mẫu 58 3.3.3 Ứng dụng kiểm định Z đánh giá kết thử nghiệm thành thạo 60 3.3.4 Ứng dụng kiểm định Z xây dựng biểu đồ kiểm soát 68 3.4 Kiểm định Grubbs ứng dụng 69 3.5 Kiểm định Fisher (F–test) ứng dụng 72 3.6 Kiểm định Chi bình phương (χ2–test) ứng dụng 76 3.6.1 Kiểm định Chi bình phương đánh giá tương quan yếu tố không qua tham số 77 3.6.2 Kiểm định Chi bình phương đánh giá đồng phương sai mẫu phương sai chuẩn cho trước 80 Mục lục 3.6.3 Kiểm định Chi bình phương đánh giá đồng nhiều phương sai 81 3.7 Kiểm định Cochran ứng dụng 83 Bài tập chương 86 Tài liệu tham khảo 88 Chương 4: Xử lý thống kê thẩm định phương pháp phân tích 90 4.1 Tính đặc hiệu, tính chọn lọc 90 4.1.1 Tính đặc hiệu 90 4.1.2 Tính chọn lọc 93 4.2 Khoảng tuyến tính, độ tương quan đường hiệu chuẩn 93 4.2.1 Đường hiệu chuẩn 93 4.2.2 Độ tuyến tính 96 4.3 Giới hạn phát hiện, giới hạn định lượng 101 4.3.1 Tính LOD dựa độ lệch chuẩn phân tích lặp mẫu trắng 102 4.3.2 Xác định LOD/MDL phân tích mẫu thêm chuẩn, mẫu thật 102 4.3.3 Tính LOD/MDL dựa S/N 104 4.3.4 Tính LOD từ đường hiệu chuẩn 105 4.3.5 Xác định LOD/MDL dựa mức tin cậy tín hiệu 105 4.4 Độ xác phương pháp phân tích 105 4.4.1 Độ chụm, độ lặp phương pháp 106 4.4.2 Độ 111 4.5 Độ không đảm bảo đo 114 4.5.1 Số đo chữ số có nghĩa 114 4.5.2 Sai số tích lũy 117 4.5.3 Độ không đảm bảo đo 120 4.5.4 Quy trình xác định độ khơng đảm bảo đo 121 4.5.5 Một số ví dụ 134 Bài tập chương 145 Tài liệu tham khảo 147 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HĨA HỌC Chương 5: Phân tích tác động yếu tố tới kết thực nghiệm 150 5.1 Phân tích phương sai yếu tố 151 5.2 Phân tích phương sai hai yếu tố không lặp 157 5.3 Phân tích phương sai hai yếu tố có lặp 164 5.4 Phân tích phương sai ba yếu tố trở lên 172 5.4.1 Phân tích phương sai ba yếu tố khơng có lặp 174 5.4.2 Phân tích phương sai ba yếu tố có lặp 178 Bài tập chương 186 Tài liệu tham khảo 188 Chương 6: Thiết kế phân tích thực nghiệm 189 6.1 Cơ sở lý thuyết thiết kế phân tích thực nghiệm 189 6.1.1 Vai trò thiết kế phân tích thực nghiệm 189 6.1.2 Thiết kế ma trận thực nghiệm 191 6.1.3 Thực nghiệm theo ma trận thiết kế 192 6.1.4 Tính tốn hệ số phương trình hồi quy 193 6.1.5 Đánh giá hệ số hồi quy 194 6.1.6 Đánh giá phương trình hồi quy 195 6.2 Mơ hình hóa thực nghiệm bậc 198 6.2.1 Mơ hình hóa thực nghiệm bậc đầy đủ 198 6.2.2 Mơ hình hóa thực nghiệm bậc rút gọn 214 6.3 Mơ hình mặt đáp ứng bậc hai 223 6.3.1 Mơ hình bậc hai tâm trực giao 224 6.3.2 Mơ hình bậc hai tâm xoay 238 6.4 Mơ hình thực nghiệm dạng hỗn hợp 248 6.4.1 Ma trận thực nghiệm mơ hình hỗn hợp 248 6.4.2 Tính tốn phương trình hồi quy 251 6.4.3 Đánh giá tính phù hợp phương trình hồi quy 253 6.5 Mơ hình đa mức thực nghiệm 260 Bài tập chương 6: 268 Tài liệu tham khảo 275 Phụ lục 276 Thuật ngữ viết tắt DANH MỤC THUẬT NGỮ VIẾT TẮT AAS (Atomic absorption spectroscopy) ANOVA (Analysis of Variance) AOAC (Association of Official Analytical Chemists) Crit (Criterial) EPA (Environmental Protection Agency) HPLC (High Performance Liquid Chromatography) GC (Gas Chromatography) ISO (International Standard Organization) LOD (Limit of Detection) LOQ (Limit of Quantification) MDL (Method Detection Limit) Phổ hấp thụ nguyên tử Phân tích phương sai Hiệp hội nhà hóa học phân tích Tiêu chí Cơ quan bảo vệ môi trường USA Sắc ký lỏng hiệu cao Sắc ký khí Tổ chức tiêu chuẩn quốc tế Giới hạn phát Giới hạn định lượng Giới hạn phát phương pháp MQL (Method Quantitation Limit) Giới hạn định lượng phương pháp MS (Mass Spectrometry) Phổ khối PT (Proficiency Testing) Thử nghiệm thành thạo QA/QC (Quality Assurance/ Quality Đảm bảo chất lượng/Kiểm soát Control) chất lượng RSD (Relative standard Deviation) Độ lệch chuẩn tương đối S/N (Signal to noise) Tỉ lệ tín hiệu nhiễu Sd (Standard Deviation) Độ lệch chuẩn Stat (Statistical) Thống kê TCVN Tiêu chuẩn Việt Nam XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC Chương Đại lượng đặc trưng tập số liệu thực nghiệm Chương ĐẠI LƯỢNG ĐẶC TRƯNG CỦA TẬP SỐ LIỆU THỰC NGHIỆM 1.1 Đại lượng đặc trưng cho tâm phân bố vị trí tập số liệu Giá trị trung bình (Mean) trung bình cộng tập số liệu, ký hiệu x x = N ∑N i=1 xi (1.1) Giá trị trung bình tập số liệu tâm tập số liệu Tâm tập số liệu lệch phía giá trị có tần suất cao (lặp lại nhiều) tập số liệu Khi tập số liệu có số lượng vô lớn (N→ ∞), giá trị trung bình tiến tới giá trị thực µ Giá trị trung bình có vai trị quan trọng đánh giá tập số liệu, đặc biệt đảm bảo chất lượng kiểm soát chất lượng (QA/QC) hoạt động kiểm nghiệm đo lường Giá trị trung bình thường sử dụng việc đánh giá độ phương pháp phân tích (trueness); đánh giá tay nghề nhân viên kiểm nghiệm; thử nghiệm thành thạo (Proficiency testing–PT) Khoảng giá trị (Range) khoảng cách giá trị lớn giá trị nhỏ tập số liệu kết đo Range = xmax – xmin (1.2) Số trung vị (Median, Med) giá trị có vị trí thứ tự tập số liệu xếp từ nhỏ đến lớn Trung vị giá trị số liệu tập số liệu (N) lẻ trung bình hai số có vị trí thứ tự tập số liệu chẵn Med = xN+1 N lẻ; Med = (xN + x(N+1) ) N chẵn 2 (1.3) Nếu giá trị trung vị gần với giá trị trung bình, tập số liệu có phân bố tương đối khoảng giá trị (range) Giá trị trung vị nhỏ giá trị trung bình cho thấy tập số liệu thực nghiệm có xu hướng Chương Đại lượng đặc trưng tập số liệu thực nghiệm 24.0 24.0 24.4 24.5 25.7 25.9 25.2 25.2 21.8 22.0 23.5 23.5 23.6 23.6 23.1 23.1 23.3 23.3 22.1 22.2 – Xác định khoảng giá trị, trung vị, giá trị trung bình tập số liệu – Xác định tần suất, số trội, phân phối tần suất tập giá trị theo khoảng giá trị 2g/kg Mô tả phân phối tần suất tập số liệu đồ thị Giải: Tập số liệu xếp lại theo thứ tự tăng dần, kết thu bảng đây: 18.3 18.4 18.5 18.9 19.3 20.1 20.2 21.3 21.4 21.4 21.6 21.7 21.8 22.0 22.1 22.2 23.1 23.1 23.3 23.3 23.5 23.5 23.6 23.6 24.0 24.0 24.4 24.5 25.2 25.2 25.5 25.5 25.7 25.9 26.1 26.3 26.6 27.6 27.7 27.9 Khoảng giá trị: R = xmax – xmin = 27.9 – 18.3 = 9.6 Giá trị trung bình: x = N ∑N i=1 xi = 928.3 40 Trung vị: Med = (xN + x(N+1) ) = ≈ 23.1 23.3+23.5 2 = 23.4 Ta thấy trung vị tập số liệu có giá trị gần giá trị trung bình, tập số liệu phân bố tương đối hai phía Các giá trị phân chia thành nhóm yêu cầu Tần số, tần suất tính tốn theo khoảng giá trị Kết trình bày bảng đây: Nhóm Khoảng nồng độ (g/kg) Tần số Tần suất (%) 18.1 – 20.0 12.5 20.1 – 22.0 22.5 22.1 – 24.0 12 30 24.1 – 26.0 20 26.1 – 28.0 15 40 100 Tổng số XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC Giá trị tần suất theo nhóm thể đồ thị ta thu phân phối tần suất hình 1.1 Hình 1.1 Đồ thị mối quan hệ tần suất giá trị theo nhóm nồng độ lipit có 40 mẫu sữa bột: nhóm 1: 18.0 – 20.0; nhóm 2: 20.1 – 22.0; nhóm 3: 22.1 – 24.0; nhóm 4: 24.1 – 26.0 nhóm 5: 26.1 – 28.0 Hình 1.2 Đồ thị tần suất dồn theo nhóm nồng độ lipit có 40 mẫu sữa bột Nhóm 1: 18.0 – 20.0; nhóm 2: 18.0 – 22.0; nhóm 3: 18.0 – 24.0; nhóm 4: 18.0 – 26.0 nhóm 5: 18.0 – 28.0 Số trội tập số liệu có giá trị tần suất lớn với pi = 30% nhóm giá trị mẫu có nồng độ từ 22.1– 24.0 g/kg Ngược lại, nhóm giá trị với nồng độ cao (18.1 – 20.0 g/kg) có tần suất thấp 12.5% Chương Đại lượng đặc trưng tập số liệu thực nghiệm 1.2 Đại lượng đặc trưng cho phân tán tập số liệu thực nghiệm 1.2.1 Phương sai (Variance, S2) Tổng bình phương sai khác giá trị tập số liệu so với giá trị trung bình tập số liệu ký hiệu SS (Sum of square): SS = ∑N i=1(xi − x) (1.5) Phương sai tập số liệu trung bình tổng bình phương sai khác giá trị tập số liệu so với giá trị trung bình tập số liệu gồm N kết đo: S2 = SS f 1 N 2 = f ∑N i=1(xi − x) = f (∑i=1 xi − (∑N i=1 xi ) N ) (1.6) Với: f bậc tự tập số liệu kết đo, thông thường f = N – Khi số thực nghiệm đủ lớn (N ≥ 30) f = N – 1≈ N Khi đó, phương sai tập mẫu (S2) trở thành phương sai tổng thể kí hiệu σ2 Phương sai biểu diễn độ phân tán/độ chụm/độ lặp giá trị so với tâm tập số liệu thực nghiệm (x) Phương sai nhỏ độ phân tán nhỏ, độ lặp độ chụm lớn ngược lại Phương sai sử dụng nhiều xử lý số liệu cụ thể như: tính khoảng biến thiên kết đo lường (ε); đánh giá độ lặp, độ tái lặp phương pháp phân tích; ước lượng độ khơng đảm bảo đo; đánh giá độ ổn định thiết bị đo; đánh giá tay nghề nhân viên kiểm nghiệm; đánh giá mức độ tác động yếu tố vào giá trị cần khảo sát; 1.2.2 Độ lệch chuẩn (Standard deviation, Sd) Độ lệch chuẩn tập số liệu bậc hai giá trị phương sai tập số liệu: Sd = √S tập số liệu lớn người ta hay dùng σd = √σ2 (1.7) Độ lệch chuẩn có thứ nguyên với giá trị tập số liệu có ý nghĩa giống phương sai 1.2.3 Độ sai chuẩn/độ lệch chuẩn trung bình (Standard error, 𝑺𝒙̅ ) Độ sai chuẩn tỉ số độ lệch chuẩn bậc hai số giá trị tập số liệu: XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC Sx̅ = Sd √N =√ ∑N i=1(xi −x) N(N−1) (1.8) Độ sai chuẩn độ lệch chuẩn trung bình có thứ nguyên ý nghĩa với độ lệch chuẩn Độ sai chuẩn dùng để biễu diễn khoảng biến thiên chuẩn giá trị thực dùng để tính khoảng biến thiên mở rộng của tập giá trị thực nghiệm độ tin cậy định 1.2.4 Khoảng biến thiên (Confidence level, ε) Khoảng biến thiên khoảng dao động giá trị thực (µ) tính từ tâm tập số liệu (x) Tập số liệu thực nghiệm giá trị rời rạc thu lần đo cụ thể, độc lập với Sau tính tốn thống kê ta mơ tả giá trị thực nghiệm khoảng giá trị liên tục độ tin cậy định dạng: µ = x ± ε hay x – ε ≤ µ ≤ x + ε (1.9) Với ε = k SX̅ k hệ số phủ, hệ số phủ k khác tùy thuộc vào quy luật phân bố độ tin cậy định 1.2.5 Độ lệch chuẩn tương đối/hệ số biến sai (Relative standard deviation, RSD%) Độ lệch chuẩn tương đối hay hệ số biến thiên tỉ số độ lệch chuẩn với giá trị trung bình: RSD (%) = Sd x 100 (1.10) RSD (%) thông thường dùng để đánh giá độ lặp phương pháp đo lường (repeatability), độ lặp trung gian/độ tái lặp nội (intermediate–precision) Tùy vào hệ thống tiêu chuẩn, đối tượng phân tích, nồng độ định lượng, giá trị lớn chấp nhận RSD quy định khác Ví dụ 1.2: Để đánh giá tay nghề kiểm nghiệm viên (KNV) phịng thí nghiệm, phận đảm bảo chất lượng tạo mẫu yêu cầu KNV phân tích mẫu kiểm sốt Kết nồng độ (mg/Kg) thu bảng sau: Chương Đại lượng đặc trưng tập số liệu thực nghiệm n KNV A KNV B KNV C KNV D 0.798 0.760 0.707 0.874 0.863 0.835 0.764 0.696 0.865 0.728 0.770 0.813 0.791 0.765 0.680 0.780 0.871 0.875 0.801 0.837 0.825 0.745 0.837 0.673 – 0.890 – 0.755 – Tính đại lượng: phương sai, độ lệch chuẩn, độ sai chuẩn, hệ số biến sai cho nhân viên Đánh giá tay nghề kiểm nghiệm viên RSD tối đa cho phép 11% – Tính phương sai tổng hợp cho tập số liệu nhân viên biểu diễn kết cuối chấp nhận khoảng biến thiên ε = ±3Sd Giải: Áp dụng công thức tính x, S2, Sd, Sx̅ , RSD cho nhân viên, kết thu bảng sau: Đại lượng KNV A KNV B KNV C KNV D Số thí nghiệm (N) 7 Bậc tự (f = N – 1) 6 Giá trị trung bình (x) 0.836 0.800 0.760 0.775 Phương sai (S2) 0.0013 0.0043 0.0034 0.0054 Độ lệch chuẩn (Sd) 0.0357 0.0658 0.0582 0.0732 Độ sai chuẩn (Sx̅ ) 0.0146 0.0249 0.0238 0.0277 4.3 8.2 7.7 9.4 RSD (%) Dựa vào kết trên, mức độ thành thạo nhân viên theo thứ tự từ thấp đến cao D, B, C, A điều nhỏ 11% Tất KNV có tay nghề đạt yêu cầu XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HĨA HỌC – Tập số liệu phân tích mẫu gộp gồm 26 giá trị, giá trị trung bình tập mẫu là: NA x̅A + NB x̅B + NC x̅C + ND x̅D x= = NA + NB + NC + ND × 0.836 + × 0.800 + × 0.760 + × 0.775 = ≈ 0.79 mg/kg 6+7+6+7 Áp dụng cơng thức 1.6 tính phương sai tập số liệu gộp tập nhân viên A, B, C, D S = 25 ∑N i=1(xi − x) = 0.0041 ∑N i=1(xi −x) Độ sai chuẩn Sx̅ = √ N(N−1) s2 0.0041 = √N = √ 26 = 0.0126 Khoảng biến thiên: ε = ±3Sd = ± 3×0.0126 = ± 0.0378 ≈ ± 0.04 Vì nồng độ tập số liệu biểu diễn 0.79 ± 0.04 mg/kg 1.3 Sai số đo lường Sai số đo lường sai lệch giá trị đo so với giá trị thực giá trị trung bình Nếu phân loại dựa theo biểu thức tính ta có sai số tuyệt đối sai số tương đối Nếu dựa vào nguyên nhân nguồn gốc gây nên, sai số phân loại thành sai số hệ thống sai số ngẫu nhiên 1.3.1 Sai số tuyệt đối Sai số tuyệt đối sai khác giá trị lần đo cụ thể với giá trị trung bình (hoặc giá trị thật) Sai số có thứ nguyên với giá trị cần đo Sai số tuyệt đối âm dương, biểu thức tính sau: x = xi – x = xi – (1.11) 1.3.2 Sai số tương đối Sai số tương đối tỉ số sai số tuyệt đối giá trị trung bình Sai số tương đối có đơn vị tính %, biểu thức tính sau: x (%) = xi −x x 100 = xi −μ μ 100 (1.12) Chương Đại lượng đặc trưng tập số liệu thực nghiệm Sai số tương đối thường sử dụng đề cập đến độ xác phép đo, phương pháp phân tích tính tốn sai số tổng hợp có nhiều sai số thành phần khơng thứ nguyên 1.3.3 Sai số hệ thống Sai số hệ thống (System error) sai số phép đo gây nên yếu tố cụ thể như: Tính chất mẫu, thiết bị, hóa chất, điều kiện tiện nghi môi trường, phương pháp người thực phép đo lường Giá trị sai số hệ thống có dấu định, dương âm có chung xu hướng (giữ nguyên, tăng dần giảm dần) thực loạt phép đo lường Thông thường giá trị xi lần đo bị sai số hệ thống nằm phía so với giá trị tham chiếu giá trị thực Mặc dù nguyên nhân sai số hệ thống cụ thể, tất phép đo có mắc loại sai số Do vậy, phải kiểm soát cải tiến để giảm thiểu tới mức tối đa sai số hệ thống phép đo Sai số hệ thống số quan trọng bậc phân tích đo lường Vì vậy, sai số hệ thống phương pháp cần kiểm soát thông qua việc tiến hành song song phép đo vật liệu chuẩn, mẫu chuẩn, mẫu thêm chuẩn, mẫu trắng so sánh liên phòng, thử nghiệm thành thạo, Ví dụ: Hiệu suất thu hồi số quan trọng biểu sai số hệ thống phương pháp phân tích Khơng thể có phương pháp phân tích với giá trị hiệu suất thu hồi 100% (không mắc sai số hệ thống) Sai số hệ thống trường hợp xác định chủ yếu từ mẫu phân tích phương pháp thực hiện, giai đoạn xử lý mẫu thường định đến giá trị hiệu suất thu hồi 1.3.4 Sai số ngẫu nhiên Sai số ngẫu nhiên (Random error): Sai số ngẫu nhiên yếu tố ngẫu nhiên gây nên (không xác định nguyên nhân cụ thể) Sai số ngẫu nhiên mắc phải thực lần đo lặp hoàn toàn giống điều kiện Đặc điểm biểu tập số liệu có sai số ngẫu nhiên giá trị phân bố hai phía giá trị tham chiếu giá trị thực 10 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC 1.4 Ứng dụng Excel tính tốn đại lượng đặc trưng tập số liệu thực nghiệm Hàm thống kê công cụ thống kê Microsoft Excel hữu ích việc tính tốn mơ tả đại lượng thống kê tập số liệu thực nghiệm Sau hàm công cụ thống kê giới thiệu để tính tốn mơ tả đại lượng thống kê trình bày mục 1.1 1.2 1.4.1 Ứng dụng hàm Excel tính thơng số tập số liệu Giá trị trung bình: Dùng hàm Average với cú pháp fx=AVERAGE(number1, number2, ) Số liệu nhập dạng chuỗi mảng hình sau: Tần số: dùng hàm Frequency với cú pháp fx=FREQUENCY(data_array, bins_array) Với data_array mảng liệu; bins_array giá trị cần tính tần số tập data_array Chương Đại lượng đặc trưng tập số liệu thực nghiệm 11 Tần suất: Tính phép tính thông thường Excel f/N Phương sai: Dùng hàm với cú pháp fx=VAR(number1, number2, ) 12 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC Độ lệch chuẩn: Dùng hàm =STDEV(number1, number2, ) STDEV với cú pháp fx Khoảng biến thiên: Dùng hàm CONFIDENCE.T với cú pháp fx=CONFIDENCE.T (alpha, standard_dev, size) Chương Đại lượng đặc trưng tập số liệu thực nghiệm 13 Số trội: Dùng hàm với cú pháp fx=MODE(number1, number2, ) Trung vị: Dùng hàm Median với cú pháp fx=MEDIAN(number1, number2, ) 1.4.2 Công cụ Excel mô tả tập số liệu thực nghiệm Với hàm Excel, đại lượng thống kê xác định cách đơn lẻ Để thực mô tả đồng thời đại lượng thống kê tập số liệu thực nghiệm, Microsoft Excel có cơng cụ mô tả thống kê Descriptive Statistics menu Data Analysis Trước tiên, cần thực thao tác kích hoạt Analysis ToolPak Excel sau: 1- Lần lượt chọn file/option/Add–Ins/ 2- Chọn Excel Add–ins hộp thoại Manage chọn Go 3- Hộp thoại Add–ins xuất hiện, chọn Analysis ToolPak chọn ok 14 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC Menu Data Analysis xuất Data (góc phải hình Excel), hồn tất việc kích hoạt cơng cụ Analysis ToolPak Thực mơ tả thống kê tập số liệu cách chọn Data Analysis chọn Descriptive Statistics, bảng nhập liệu xuất hiện: Thực khai báo bảng Descriptive Statistics gồm hai phần: Input Output option Chọn vùng xuất liệu, chọn bảng tổng hợp thống kê Chương Đại lượng đặc trưng tập số liệu thực nghiệm 15 (Summary statistics) độ tin cậy 95% (Confidence Level for Mean) chọn ok, kết mô tả thống kê tập số liệu thu bảng sau: Giá trị trung bình Mean Độ sai chuẩn Standard Error Trung vị Median Số trội Mode Độ lệch chuẩn Standard Deviation Phương sai Sample Variance Độ nhọn đỉnh Kurtosis Độ nghiêng Skewness Khoảng giá trị Range Minimum Giá trị nhỏ Maximum Giá trị lớn Sum Tổng giá trị Count Số lượng giá trị Khoảng biến thiên Confidence Level(95.0%) Ví dụ 1.3: Kết kiểm sốt nồng độ bụi chì trung bình 24h (µg/m3) khơng khí xung quanh khu chế xuất thu bảng sau: 0.79 0.86 0.86 0.79 0.87 0.82 0.83 0.72 0.76 0.87 0.74 0.89 0.76 Sử dụng công cụ Excel mô tả thống kê tập số liệu trên, chất lượng khơng khí tiêu chuẩn bụi chì có đạt hay khơng độ tin cậy 95% nồng độ tối đa cho phép 1.5 µg/m3 (Theo QCVN05: 2013/BTNMT) Giải: Sử dụng công cụ Descriptive Statistics để mô tả thống kê theo hướng dẫn ta thu kết sau: Mean 0.812307692 Standard Error 0.01557257 Median 0.82 16 XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC Mode 0.79 Standard Deviation 0.056147699 Sample Variance 0.003152564 Kurtosis –1.368457229 Skewness –0.220920103 Range 0.17 Minimum 0.72 Maximum 0.89 Sum 10.56 Count 13 Confidence Level(95.0%) 0.033929715 Kết thu bao gồm hầu hết đại lượng thống kê tập số liệu Giá trị trung bình khoảng biến thiên tập số liệu 0.81 0.04 Do vậy, nồng độ chì khơng khí biểu diễn 0.81 ± 0.04 µg/m3 cho tập số liệu nói BÀI TẬP CHƯƠNG 1: Bài tập 1.1: Một tập giá trị thực nghiệm kết kiểm soát hàm lượng kim loại nặng (mg/L) nước thải khu công nghiệp thu bảng sau: 4.15 2.20 2.48 0.29 4.96 2.22 0.82 0.82 0.27 0.29 1.65 4.43 1.11 8.28 1.11 0.27 1.11 0.84 4.43 6.62 3.86 0.29 2.49 0.27 3.60 12.08 0.56 1.10 0.29 10.45 – Xác định khoảng giá trị, trung vị, giá trị trung bình tập số liệu – Xác định tần suất, số trội, phân phối tần suất tập giá trị theo khoảng giá trị mg/L Bài tập 1.2: Độ lặp lại phương pháp xác định protein thô (%) loại thực phẩm đánh giá phân tích lặp 10 lần Chương Đại lượng đặc trưng tập số liệu thực nghiệm 17 lượng mẫu, sử dụng phương pháp, thiết bị kiểm nghiệm khoảng thời gian ngắn Kết thu dãy sau: Mẫu 10 Kết 10.5 10.7 10.8 10.6 10.4 10.5 10.2 10.5 10.6 10.2 a) Tính tốn thơng số thống kê tập kết thực nghiệm trên; b) Dùng công cụ Excel mô tả thống kê tập số liệu trên; c) Nếu độ lặp tiêu chuẩn có RSD ≤ 3% kết phân tích có đáp ứng u cầu? Tài liệu tham khảo James N Miller, Jane C Miller, Robert D Miller, Statistics and Chemometrics for Analytical Chemistry, 7th Edition, Pearson Education Limited (2018) Michael Thompson, Philip J Lowthian Notes on Statistics and Data Quality for Analytical Chemists, Imperial College Press (2011) Lê Đức Ngọc, Vũ Thị Quyên Nhập mơn Xử lý số liệu kế hoạch hóa thực nghiệm Hóa học NXB ĐHQG Hà Nội (2017) ... số liệu quy hoạch thực nghiệm nội dung quan trọng ngành Hóa phân tích Cơng nghệ hóa học Nội dung giáo trình ? ?Xử lý số liệu Quy hoạch thực nghiệm Hóa học? ?? tập trung vào việc vận dụng lý thuyết... TCVN Tiêu chuẩn Việt Nam XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC Chương Đại lượng đặc trưng tập số liệu thực nghiệm Chương ĐẠI LƯỢNG ĐẶC TRƯNG CỦA TẬP SỐ LIỆU THỰC NGHIỆM 1.1 Đại lượng đặc... bình cho thấy tập số liệu thực nghiệm có xu hướng XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HĨA HỌC lệch phía giá trị nhỏ Ngược lại trung vị lớn giá trị trung bình tập số liệu thực nghiệm có xu hướng