Hầu hết các thực nghiệm phân tích mang lại số liệu đo đạc cần được biểu thị, được phân tích và được làm sáng tỏ trong mối quan hệ của các hiện tượng hóa học đang được nghiên cứu. Cho nên các dữ liệu và phép phân tích liên quan dùng để làm bằng chứng phong phú, có thể mang lại sự diễn đạt thông tin cần thiết để sử dụng. Khoa học thống kê cung cấp nhiều phương thức thông qua cách biểu diễn đa dạng, phương thức đơn giản, phổ biến để giúp các nhà khoa học trong việc sưu tầm và phân tích dữ liệu của họ để thông tin trong dữ liệu có thể trở thành thông tin khoa học hữu ích và có ý nghĩa hơn. Mở đường cho nguyên lý, quan niệm khoa học thống kê bắt đầu vào thế kỷ XVIII từ
Trang 1(Bản dịch của lớp Cao học khóa 20 – Khoa Hóa học,
Trường ĐHKHTN- Phùng Mạnh Quân biên tập)
Hà Nội, 3- 2010
Trang 2ii
Lời mở đầu
Các nhà hóa học thực hiện các thực nghiệm để tìm hiểu các hiện tượng hóa học, để theo dõi và phát triển các quy trình phân tích mới, và để khảo sát các yếu tố hóa học như nhiệt độ, nồng độ chất xúc tác, pH, điều kiện bảo quản của các chất và các quy trình phân tích ảnh hưởng đến các kết quả hóa học đến mức độ nào Tất cả các thực nghiệm hóa học đó cho ta các dữ liệu, các dữ liệu này cần được phân tích và làm sáng
tỏ các kết quả của thực nghiệm và các yếu tố hóa học ảnh hưởng đến các kết quả đo đạc được Để diễn giải các số liệu hóa học thành các kết quả hóa học có ý nghĩa, nhà hóa học phải có khả năng sử dụng các công cụ trình bày và phân tích, từ đó có thể đánh giá được thông tin hóa học trong các số liệu thu thập được
Phương pháp phân tích dữ liệu thống kê cung cấp các công cụ trên, các phương pháp này cần được tích hợp vào trong việc thiết kế và thống kê các thực nghiệm hóa học, kể
cả các thực nghiệm phức tạp Vì thế, nhà hóa học cần quen thuộc với các kỹ thuật thống kê trong thăm dò và suy luận khi thiết kế các thực nghiệm để thu được các thông tin hóa học thích hợp của đối tượng nghiên cứu hoặc khi xử lý các số liệu thu thập được để tăng thêm kiến thức về các hiện tượng hóa học được nghiên cứu
Mục đích của cuốn sách này là nhằm giúp các nhà hóa học hiểu rõ giá trị và cách sử dụng thống kê, trang bị khả năng ứng dụng các phương pháp thống kê và biết cách lập luận từ việc trình bày và phân tích các dữ liệu hóa học thu được từ thực nghiệm Chủ
đề của cuốn sách là mô tả ứng dụng của các kỹ thuật thống kê sử dụng các dữ liệu hóa học thực tế cũng như những gì chúng có khả năng mô tả đối với phân tích dữ liệu và các khái niệm mô tả Sự mô tả được giải thích từ khía cạnh phân tích các dữ liệu khai thác và phân tích dữ liệu suy luận thông qua sự cung cấp các lời giải cụ thể Điều này giúp người đọc hiểu rõ hơn cách phân tích dữ liệu và thống kê có thể đóng vai trò trong thiết kế và sáng tỏ khía cạnh của các thực nghiệm hóa học Tôi tán thành xu thế
sử dụng phân tích số liệu khai thác trong giảng dạy thống kê để khảo sát dữ liệu bằng hình ảnh và số cho xu hướng hoặc nhóm sẵn có Sử dụng các phần mềm thống kê dễ dàng xử lý số liệu và cho phép người dùng tập trung hơn vào các số liệu thu thập được
Các công cụ thống kê được mô tả theo một cách thực tiễn nhất để giúp người đọc hiểu được cách sử dụng các kỹ thuật Các vấn đề kỹ thuật thuộc về toán học và tính toán cũng được nhấn mạnh lại nhờ vào việc cung cấp cho người đọc những minh họa cách khai thác số liệu, từ đó người đọc có thể dễ dàng liên hệ và xem xét các minh họa trên
cơ sở phần mềm (Excel và Minitab) Mục đích của cuốn sách là để cung cấp cho người đọc các kỹ năng và kỹ thuật thống kê, từ đó người đọc có thể áp dụng vào các
số liệu thực nghiệm sử dụng các minh họa thực tế Mỗi chương bao gồm các bài tập đơn giản, dễ ứng dụng cho người đọc để giúp người đọc biết cách trình bày và phân
Trang 3và phân tích đa biến (MVA), chúng có ứng dụng rộng để giải quyết các vấn đề hóa học, mỗi chủ đề đều được trình bày đủ để có thể được tìm hiểu một cách độc lập
Trang 4iv
Thuật ngữ
Absolute error Sai số tuyệt đối Sự sai khác giữa giá trị thực và giá trị đo được
của một kết quả hóa học
Accuracy Độ chính xác Mức độ phù hợp giữa các lần đo lặp lại của một
tính chất hóa học và giá trị chuẩn đã biết
được
Bias Độ chênh lệch Mức độ biến thiên của các số liệu thực nghiệm so
với số liệu chuẩn
Blocking Sự nhóm khối Nhóm các đơn vị thực nghiệm trong một khối
đồng nhất với mục đích thực nghiệm
Boxplot Đồ thị hộp Một đồ thị dữ liệu bao gồm các phần dư và một
hộp từ điểm tứ vị phân dưới lên tứ vị phân trên và được phân cắt bởi số trung vị nhằm mục đích xác định độ trải rộng của dữ liệu cùng với các giá trị ngoại lai
Chemometrics Hóa đạc Một phương pháp kết hợp toán học và thống kê
nhằm tách được các thông tin từ các dữ liệu hóa học
Cluster analysis Phân tích nhóm Một quy trình phân loại và nhóm MVA (phân tích
đa biến) để xác định các nhóm phần tử dựa vào việc đo đạc nhiều biến kết quả
Confidence
interval
Khoảng tin cậy Một khoảng giá trị chứa kết quả thực nghiệm sau
khi ước lượng
Correspondence
analysis
Phân tích tương quan
Một phương pháp sắp xếp MVA nhằm đánh giá cấu trúc và mô hình trong dữ liệu đa biến
Trang 5v
Data reduction Rút gọn dữ liệu Một kỹ thuật để giảm tập dữ liệu đa biến về các
thành phần không tương quan, từ đó giải thích cấu trúc hóa học của dữ liệu
Decision rule Quy tắc quyết định Cách dùng phép thống kê thử nghiệm hoặc giá trị
p để quyết định việc chấp nhận hay phủ định giả thiết không trong phân tích dữ liệu kết luận
Degrees of
freedom (df)
Bậc tự do Số lần đo độc lập dùng để ước lượng tham số Nó
thường tương ứng với số lần đo trừ đi số tham số
để ước lượng
Descriptive
statistics
Thống kê mô tả Bao gồm tổ chức dữ liệu, mô tả bằng hình ảnh và
tính toán các thống kê liên quan
Distance Khoảng Đo mức độ giống nhau hay khác nhau của mẫu
hay nhóm mẫu dựa trên đặc điểm chung với các giá trị nhỏ chỉ thị của đồng dạng
Dotplot Đồ thị điểm Một loại đồ thị dữ liệu trong đó mỗi quan sát
được biểu thị bởi một điểm để từ đó xác định vị trí tương đối của nó so với các đo đạc khác trong tập dữ liệu
Eigenvalues Giá trị đặc trưng Sự đánh giá tầm quan trọng của ‘biến được suy’
trong phương pháp MVA về mặt giải thích cấu trúc của dữ liệu đa biến
Eigenvectors Vecto đặc trưng Hệ số ước lượng của các biến đáp ứng trong mỗi
‘biến được suy’ trong phương pháp MVA
Error Sai số Sự khác biệt của kết quả đo hóa học so với giá trị
thực của nó
Estimation Ước lượng Phương pháp ước lượng độ lớn của một yếu tố
thực nghiệm lên một thực nghiệm hóa học
Experiment Thực nghiệm Kế hoạch để thu thập thông tin về một kết quả
hóa học hoặc khẳng định các kết quả từ các nghiên cứu trước
Experimental
design
Kế hoạch hóa thực nghiệm
Một cấu trúc thực nghiệm để thu được các số liệu hóa học
Trang 6vi
Experimental
plan
Kế hoạch thực nghiệm
Hướng dẫn từng bước các thí nghiệm hóa học và phân tích các kết quả sau đó
Experimental
unit
Đơn vị thực nghiệm
Một đơn vị thực nghiệm là một thí nghiệm trong
đó các điều kiện thực nghiệm được áp dụng, ví dụ như dung dịch hóa học, mẫu nước, mẫu đất, hoặc mẫu thực phẩm
Exploratory
data analysis
(EDA)
Phân tích số liệu điều tra
Kỹ thuật hình ảnh và số để trình bày và phân tích
dữ liệu thực nghiệm nhằm mục đích thu được những thông tin ban đầu về cấu trúc dữ liệu
Factor analysis
(FA)
Phân tích nhân tố Kỹ thuật khử dữ liệu MVA nhằm mục đích xác
định cấu trúc dữ liệu và dạng của dữ liệu đa biến
Heteroscedastic Trình bày dữ liệu những biến thiên không phải là
hằng số khi giá trị trung bình thay đổi
Homoscedastic Trình bày dữ liệu những biến thiên là hằng số khi
giá trị trung bình thay đổi
Inferential data
analysis
Phân tích dữ liệu kết luận
Cách kết luận nhằm mục đích kiểm tra tính có nghĩa thống kê của dữ liệu thu thập được thông qua xác định sự rõ ràng trong dữ liệu đối với một kết quả cụ thể
Location Sự định xứ Trung tâm của một bộ dữ liệu, trong đó các kết
quả thu được có xu hướng tập trung thành cụm, ví
dụ như giá trị trung bình, media
Mean Giá trị trung bình Trung bình số học của một tập các kết quả đo
thực nghiệm
Median Trung vị Trung tâm của một tập các kết quả đo thực
nghiệm khi biểu diễn theo thứ tự tăng dần về độ lớn
Trang 7vii
Model Mô hình Một cách thống kê trong đó các kết quả thực
nghiệm được giải thích thông qua các yếu tố điều khiển trong thực nghiệm
Kỹ thuật mô tả trong đó các kết quả thực nghiệm
Y là hàm tuyến tính của nhiều biến X
MVA MVA Ký hiệu thu gọn của phương pháp đa biến cho các
bộ dữ liệu đa biến bao gồm các phép đo nhiều biến trên nhiều mẫu
Non-parametric
procedures
Phương pháp phi tham số
Các phương pháp phân tích dữ liệu kết luận, thường dựa vào việc xếp hạng, không yêu cầu giả thiết tính chuẩn của kết quả đo
đo trong kết luận tham số
Null hypothesis Giả thiết không Giả thiết thể hiện sự giống nhau giữa các số liệu
và đối tượng hoặc giữa các bộ số liệu (ký hiệu là
Một kỹ thuật ước lượng tham số được dùng trong hồi quy để xác định quan hệ tốt nhất giữa kết quả
Y vào một hoặc nhiều biến thực nghiệm
Outlier Giá trị ngoại lai Một kết quả đo khác biệt đáng kể so với phần lớn
các kết quả của bộ dữ liệu
Paired sampling Lấy mẫu cặp Một nguyên tắc thiết kế trong đó đối tượng thực
nghiệm được chia thành hai phần đều nhau, mỗi phần được thử nghiệm trong mỗi điều kiện xử lý
Parameters Tham số Thuật ngữ trong mô hình kết quả trong đó yêu cầu
cần được ước lượng độ tin cậy thống kê
Parametric Phương pháp tham Các phương pháp phân tích dữ liệu kết luận dựa
vào giả thiết kết quả đo tuân theo phân phối
Trang 8viii
Power Power Xác định xác suất đúng khi bác bỏ giả thiết
không
Power analysis Phân tích power Một phần quan trọng trong thiết kế kế hoạch để
ước lượng cấu trúc thiết kế dựa vào sự khác biệt hóa học xác định bởi kế hoạch thực nghiệm
Principal
component
analysis (PCA)
Phân tích cấu tử chính (PCA)
Một kỹ thuật rút ngắn dữ liệu MVA của dữ liệu
đa biến nhằm xác định cấu trúc và dạng trong dữ liệu
Principal
components
(PC)
Cấu tử chính Kết hợp không tương quan tuyến tính của các
biến trong PCA nhằm đo sự biến thiên trong bộ
dữ liệu đa biến
Các phương pháp liên quan đến kiểm định thực nghiệm trong phòng thí nghiệm và đo đạc dể chắc chắn về độ tin cậy của các phép đo phân tích
Quality control
(QC)
Quality control Phương pháp kiểm tra các phép đo phân tích
không có lỗi và tuân theo độ sai biệt và độ chính xác chấp nhận được
Quantitative
data
Dữ liệu định lượng Các phép đo vật lý của một đặc trưng hóa học nào
đó
Trang 9ix
Random error Sai số ngẫu nhiên Làm cho phép đo hóa học rơi vào cả hai bên của
kết quả và có thể ảnh hưởng đến độ sai biệt của kết quả
Randomisation Ngẫu nhiên hóa Tránh sai số hệ thống bằng việc chắc chắn tất cả
các thực nghiệm có cùng xác suất được chọn trong một thí nghiệm
Range Khoảng Phép đo khoảng dữ liệu
Ranking Hạng Số thứ tự tương ứng với vị trí của phép đo khi sắp
xếp từ dưới lên trên
Relative
standard
deviation (RSD)
Sự lệch chuẩn tương đối (RSD)
Phép đo độc lập về độ sai biệt của các dữ liệu thực nghiệm lặp
Repeatability Kiểm tra tính lặp
lại
Phép đo độ sai biệt của một phương pháp dựa vào
sự phù hợp với một phép đo độc lập thực hiện bởi một người phân tích sử dụng cùng dụng cụ thí nghiệm và kỹ thuật trong khoảng thời gian ngắn
Replication Lặp lại thực
nghiệm
Khái niệm về lặp lại thực nghiệm để thu được nhiều kết quả nhằm mục đích ước lượng được độ chính xác và độ sai biệt
Reproducibility Reproducibility Phép đo độ sai biệt của một phương pháp dựa vào
sự phù hợp giữa các phép đo thực hiện ở các phòng thí nghiệm khác nhau
Residuals Phần dư Ước lượng sai số của mô hình dựa vào sự khác
biệt giữa các quan sát thu được và mô hình phù hợp
Response Kết quả Đặc trưng hóa học được đo trong một thực
nghiệm
Robust statistics Thống kê thô Tổng kết dữ liệu mà không làm ảnh hưởng đến
giá trị ngoại lai và các phép đo sai
Sample Mẫu Một bộ các phép đo đại diện của một kết quả hóa
Trang 10Skewness Hệ số lệch Phép đo dạng của dữ liệu nhằm kết luận về tính
đối xứng hay bất đối xứng của chúng
Smoothing Làm trơn Một kỹ thuật khớp các liên hệ khác nhau với các
khoảng khác nhau của dữ liệu thực nghiệm X trong hồi quy
Sorting and
grouping
Sắp xếp và tạo nhóm
Kỹ thuật tạo nhóm một bộ dữ liệu đa biến thành các nhóm đặc trưng có những đặc tính đo đạc tương tự nhau
Standard
deviation
Độ lệch chuẩn Phép đo độ lớn của độ sai chuẩn tuyệt đối của các
dữ liệu thực nghiệm lặp lại
Statistical
discriminant
analysis (SDA)
Phân tích biệt số thống kê
Một kỹ thuật sắp xếp và tạo nhóm MVA nhằm mục đích phân biệt các nhóm của mẫu dựa vào các phép đo nhiều đặc tính chung
Systematic
error
Sai số hệ thống Làm cho các phép đo hóa học bị sai lệch và ảnh
hưởng đến độ chính xác của dữ liệu
Test statistic Thống kê kiểm
định
Một công thức toán học đánh giá được nhờ các dữ liệu thực nghiệm, công thức này cho phép xác định bằng chứng các dữ liệu thực nghiệm về chấp nhận hoặc phủ định giả thiết không
Transformation Chuẩn hóa Một kỹ thuật tác động lên các dữ liệu thực
nghiệm thu được từ đó các biến không chuẩn tắc
và các biến không tham số của dữ liệu thu được
có thể được hiệu chỉnh
Trang 11xi
Type I error
(False positive)
Sai lầm loại I Phủ định một giả thiết không trong khi giả thiết
này lại đúng, xác suất dựa vào độ tin cậy của kiểm định kết luận
Phương sai Mức độ biến thiên trong dữ liệu thực nghiệm thu
được về cách chúng tập trung xung quanh giá trị
‘trung tâm’
Weights Trọng số Phép đo tương quan giữa các biến kết quả và các
cấu tử chính trong phép phân tích cấu tử chính về mặt các biến đóng góp như thế nào đến cấu trúc giải thích bởi cấu tử chính kết hợp
Trang 12
6.1 Kiểm định giả thiết cho giá trị trung bình 42
7.1 Kiểm định giả thiết cho giá trị trung bình 53
8.1 Kiểm định giả thiết cho giá trị trung bình 63
9 Ước lượng kích thước mẫu trong thiết kế thực nghiệm 73 9.1 Ước lượng kích thước mẫu cho thí nghiệm hai mẫu 73 9.2 Ước lượng kích thước mẫu cho thí nghiệm cặp mẫu 76
Trang 13xiii
10 Kiểm định chất lượng và điều khiển chất lượng 78
Chương 3 Kế hoạch hóa thực nghiệm một nhân tố cho thực nghiệm hóa học
3 Các trình tự tiến hành cho kế hoạch hóa một nhân tố 93
6.4 Nguyên lý ANOVA, kiểm định thống kê và phân tích bám sát 112
7 Những khía cạnh khác của thiết kế một nhân tố 121
8 Phân tích power trong kế hoạch hóa thực nghiệm 122
3.2 Tương tác không quan trọng nhưng yếu tố hiệu quả quan trọng 149
Trang 14xiv
3.4 Tổng quan về thiết kế thực nghiệm hai nhân tố 152
4 Phân tích Power trọng thiết kế thực nghiệm hai nhân tố 152
5 Những yếu tố khác liên quan đến thiết kế thực nghiệm hai nhân tố 155
6 Phương pháp kiểm định thực nghiệm hai nhân tố 156
7 Thiết kế thực nghiệm ba nhân tố với n lần lặp mỗi ô 156
7.3 Tổng quan về thiết kế thực nghiệm ba nhân tố 159
8 Những yếu tố khác liên quan đến thiết kế thực nghiệm hai nhân tố
3 Đanh giá hiệu lực của mô hình tuyến tính khớp 178 3.1 Hiệu lực thống kê của phương trình hồi quy 179
4 Những khía cạnh khác của phân tích hồi quy đa biến 186 4.1 Phép thử riêng biệt về độ dốc tương phản so với mục tiêu 186
Trang 15
xv
Chương 6 Phân tích dữ liệu suy luận phi tham số
3 Các phượng pháp kết luận cho thí nghiệm hai mẫu 229 3.1 Kiểm tra giả thiết cho sự khác nhau của trung vị 230 3.2 Khoảng tin cậy cho sự khác nhau của trung vị 234
4 Các phương pháp kết luận cho thí nghiệm từng đôi một 235 4.1 Kiểm tra giả thiết cho sự khác nhau của trung vị 234 4.2 Khoảng tin cậy cho sự khác nhau của trung vị 240
5.2 So sánh kép liên hệ với kiểm định Kruskal Wallis 245
6.2 So sánh kép liên hệ với kiểm định Friedman 254
9 Kiểm tra tính chuẩn hóa của dữ liệu thực nghiệm hóa học 258
9.2 Kiểm định thống kê cho đánh giá tính chuẩn 261
Chương 7 Thiết kế hai nhân tố trong thực nghiệm hóa học
Trang 17CHƯƠNG 1
GIỚI THIỆU CHUNG
1 GIỚI THIỆU CHUNG
Hầu hết các thực nghiệm phân tích mang lại số liệu đo đạc cần được biểu thị, được phân tích và được làm sáng tỏ trong mối quan hệ của các hiện tượng hóa học đang được nghiên cứu Cho nên các dữ liệu và phép phân tích liên quan dùng để làm bằng chứng phong phú, có thể mang lại sự diễn đạt thông tin cần thiết để sử dụng Khoa học thống kê cung cấp nhiều phương thức thông qua cách biểu diễn đa dạng, phương thức đơn giản, phổ biến để giúp các nhà khoa học trong việc sưu tầm và phân tích dữ liệu của họ để thông tin trong dữ liệu có thể trở thành thông tin khoa học hữu ích và có
ý nghĩa hơn
Mở đường cho nguyên lý, quan niệm khoa học thống kê bắt đầu vào thế kỷ XVIII từ Bayes, Gauss, Laplace Những cá nhân như Francis Galton, Karl Pearson, Ronald Fisher, Egon Pearson và Jerzy Neyman đã tiếp tục phát triển nó vào nửa đầu thế kỷ
XX Sự phát triển của những khám phá cơ bản và những công nghệ phân tích dữ liệu kiểu suy đoán đã phát sinh từ vấn đề thực tiễn như: thuyết tiến hóa của Dacuyn, thuyết
về di truyền học của Mendel, và công việc của Fisher trong các thí nghiệm về nông nghiệp Trong những vấn đề đó, sự hiểu biết và khả năng của những ảnh hưởng sinh học trong sự thay đổi của loài, giống là vấn đề cần thiết phải diễn giải về các nghiên cứu Công nghệ thống kê vẫn đang được phát triển hầu hết trong mối liên hệ giữa những cần thiết trong thực tế với mạng lưới trung gian nhân tạo (ANN), phương thức
ảo, và sự tìm thấy mối liên hệ giữa hoạt tính – cấu trúc (SAR) hỗ trợ nhiều trong ngành khoa học hóa học
Những số liệu thống kê có thể được cung cấp trong phạm vi rộng các môn học để hỗ trợ việc sưu tầm và diễn giải các số liệu Hai trích dẫn gần đây nhất tóm tắt vai trò của những thông số thống kê có thể coi là phần không thể thiếu trong thực nghiệm hóa học, đặc biệt là:
“Khoa học thống kê có thể được hiểu như nghiên cứu sự biến đổi có thể xảy ra và những phương pháp thống kê có thể cung cấp bất kể khi nào, tất cả những cái mà sự thay đổi ảnh hưởng đến hiện tượng hóa học đó đang được nghiên cứu”
“Những số liệu thống kê đó là một khoa học đề cập đến sự tổng hợp, sự phân loại, sự diễn giải những dữ liệu phân tích, việc ứng dụng của lý thuyết xác suất tới phép phân tích và sự ước lượng các tham số”
Kết hợp những trích dẫn nêu bật rằng những số liệu thống kê là một công cụ khoa học dành riêng cho tất cả các khía cạnh của thực nghiệm, từ việc phân tích dữ liệu nhằm đơn giản dữ liệu để cung cấp cách biểu đạt khi phân tích nhằm mục đích thí nghiệm
Từ khi những đo đạc của hóa học là chủ đề thay đổi cái cố hữu, những phương pháp
Trang 18thống kê cung cấp công cụ ý nghĩa để giải thích nét đặc trưng trong việc tính toán cho
sự biến đổi vốn có đó Vốn kiến thức về nguyên lý và phương pháp thống kê (điểm mạnh cũng như điểm yếu) là một phần của sự tinh xảo, kĩ năng của các nhà khoa học được xét trong sự sưu tầm, diễn giải số liệu cũng như toàn phần mô tả bản thảo Những số liệu thống kê cũng không được xem như một cách giải thích mà chỉ ra để biểu diễn sau khi dữ liệu được sưu tập Cái chốt có trong phần hổng của vấn đề Việc ứng dụng phương pháp thống kê thường được trình bày trong ngành khoa học
Thí nghiệm hóa học ứng dụng nói chung nằm ở một trong ba trường hợp sau: sự định phân(kiểm tra định lượng), sự tối ưu hóa, mô hình hóa Sự định phân có liên quan chủ yếu tới quá trình kiểm tra ví dụ: mức độ phổ biến, việc khảo sát dữ liệu được kết cấu như thế nào?, sự đảm bảo chất lượng của các phòng thí nghiệm phân tích và việc kiểm soát chất lượng của mẫu thí nghiệm như là những vật chất mấu chốt của ngôi nhà và chất điểm được xác nhận Sự tối ưu hóa thường thống nhất trong việc tìm kiếm hoặc điều tra nghiên cứu, tiến hành khi muốn đưa đến sự tối ưu cho một quá trình hóa học,
có thể được ảnh hưởng bởi một con số trong những chỉ số có liên quan Trường hợp những thí nghiệm có thể xuất hiện cả sự tối ưu hóa của quá trình phân tích, sự tối ưu hóa của quá trình hóa học mới, sự ước lượng những nhân tố hóa học khác dẫn đến sự thay đổi cho sản phẩm Thông thường kiểu thí nghiệm là căn cứ cho sự thăm dó “một chỉ số ở một thời gian nào đó tương ứng”, gần như việc đó không hiệu quả và cung cấp chỉ một phần thông tin Thông qua sự sửa đổi đơn giản hóa và hợp logic của việc kết hợp “một chỉ số ở một thời gian”để đảm bảo tất cả việc kết hợp chỉ số, nhân tố một cách hợp lý là có thể Thực nghiệm có thể tạo ra hiệu quả hơn và cung cấp càng nhiều thông tin thích hợp, hữu ích trong những ảnh hưởng của các nhân tố như là những thông tin thích hợp Nghệ thuật mô hình hóa, trong khía cạnh khác, cố gắng xây dựng mô hình của qui trình hóa học được cho là một sự tiên đoán có mục đích Nó cũng thường xuyên dựa trên kết quả thu được từ sự tối ưu hóa trong thực nghiệm nơi
mà tầm quan trọng của hệ số được xem xét và quan trọng nhất của thừa số nhằm cho việc xây dựng mẫu điển hình
Tôi sẽ cho rằng tất cả ứng dụng hóa học thực nghiệm của mẫu này trong mối quan hệ nhằm giải thích bằng phương pháp thống kê có thể cung cấp thêm sự hiểu biết và giải thích các dữ liệu thu thập được trong mối quan hệ với mục tiêu thí nghiệm Chương 2 cung cấp khái quát tham dò về phân tích dữ liệu (đồ thị và bảng tóm tắt) và kết luận từ phân tích dữ liệu (kiểm tra giả thiết và dự đoán) cho 1 và 2 ví dụ thực nghiệm Chương 3-4 mở rộng đưa thêm vào cấu trúc mô hình chính thức hơn cho 1, 2, 3 thừa
số thực nghiệm với chương 4 gộp lại trên mô hình thừa số, dễ dàng hơn thiết lập thay thế gần hơn OFAT cổ điển Một giới thiệu quan trọng về mẫu được cung cấp trong chương 5 thông qua phương pháp hồi quy phù hợp cho mối tương quan phù hợp(tuyến tính, tổ hợp) cho dữ liệu hóa học Phân tích ứng dụng của phương pháp kĩ thuật trên mẫu của sự điều chỉnh và so sánh 2 đại lượng tuyến tính sẽ được phân tích Chương 6
Trang 19giới thiệu phương pháp phi tham số thay thế cho tham số thủ tục đề cập trước đó Dựa trên phương pháp thực nghiệm liên quan đến sự tối ưu hóa được đề cập thêm trong chương 7 thông qua 2 cấp thừa số mẫu cho nhiều thừa số thực nghiệm Chương cuối, chương 8, giới thiệu về phương pháp đa biến phù hợp để xử lý tập hợp các dữ liệu phản hồi nhiều kĩ thuật và nguyên lý sẽ được tìm hiểu thường xuyên là đánh dấu cho các cuộc thảo luận của Hóa Đạc, nhân vật đã đưa ra đánh dấu phương pháp kỉ luật sử dụng trong toán học và phương pháp thống kê giúp cho thu được thông tin thích hợp
từ các dữ liệu hóa chất
Nguồn năng lượng tăng mạnh, các phần mềm và máy tính sẵn có đã cho phép những phương pháp thống kê phát triển phổ biến, sẵn có và đơn giản hơn cho cách giải quyết những dữ liệu hóa học Trên cơ sở này thì tất cả các khái niệm phân tích sẽ được điều chình khi sử dụng phần mềm (Excel và Minitab) để cung cấp cách biểu diễn số liệu trên đó phép phân tích có thể được làm cơ sở Khi đó thì vấn đề toán học chính xác dữ liệu thống kê sẽ được lờ đi, thậm chí là cố ý lờ đi Để có thể xây dựng được bức tranh về những dữ liệu thống kê có thể dự kiến phép đo qua thông tin về chất từ phần mềm đưa ra Hầu hết các phương pháp được bàn luận tới thuộc loại cổ điển tuy vậy những phương pháp ứng dụng này vẫn còn đang phát triển
2 TẠI SAO SỬ DỤNG THỐNG KÊ?
Một câu hỏi thường xuyên được đưa ra bởi các nhà hóa học đó là “Những dữ liệu thống kê có giá trị và liên quan gì tới hóa học” Các dữ liệu thống kê được mô tả như một tập hợp of techniques which cover the design of experiments, the collection of experimental data, the modes of presentation of data, and the ways in which data can
be analysed for the information they contain Statistical concepts, therefore, are relevant to all aspects of experimen- tation ranging from planning to interpretation The latter can be subjective (exploratory data analysis, EDA) as well as objective (infer- ential data analysis, estimation) but the basic rule must be to under- stand the data as fully as possible by presenting and analysing them in a form whereby the information sought can be readily found Examples where statistical methods could be useful include:
• Assessing whether analytical procedures and/or laboratories differ in accuracy (systematic error) and precision (random error) of reported measurements,
• Assessing how changing experimental conditions affect a particular chemical outcome,
• Assessing the effect of many factors on the fluorescence of a chemical complex
Such experimentation would produce numerical data which would require to be presented and analysed in order to extract the information they provide in respect of the experimental objective Statistics, through its presentational and interpretational
Trang 20procedures, can provide such means of turning data into useful chemical information which explain the phenomena investigated Statistics can also provide tools for designing experiments ranging from simple laboratory experiments to complex experiments for analy- tical procedures As assessment of chemical data is becoming more technical and demanding, this, in turn, is requiring chemists to consider more actively design structures that are efficient and to put greater emphasis on how they present and analyse their data using statistical methods Such pressure encourages a greater awareness of the role of statistics in scientific experimentation3 together with a greater level of usage Use of statistical techniques are advocated by professional bodies such as The Royal Society of Chemistry (RSC) and the Association of Official Analytical Chemists (AOAC) for the handling and assessment of analytical data to ensure their quality and reliability Statistical procedures appropriate to this type of approach form the basis of the Valid Analytical Measurement (VAM) scheme produced by the La- boratory of the Government Chemist (LGC)? the National Measure ment and Accreditation Service (NAMAS) of the United Kingdom Accreditation Service (UKAS), and other schemes including IS09000, BS5750, and GLP for the reporting of analytical measurements These support initiatives and accreditation schemes highlight the importance placed on using statistical methods as integral to chemical data hand- ling
3 PLANNING AND DESIGN OF EXPERIMENTS
In designing an experiment, we need to have a clear understanding of the purpose of the experiment (objective), how and what response data are to be collected (measurements to be made), and how these are to be displayed and analysed (statistical analysis methods) Design and statistical analysis must be considered as one entity and not separate parts to be put together as necessary A well planned experiment will produce useful chemical data which will be easy to analyse by the statistical methods chosen A badly designed and planned experiment will not be easy
to analyse even if statistical methods are applied Why is design so important? Inadequate designs provide inadequate data, so if we wish to assess experimental objectives properly, we need to design the experiment so that appropriate information for assessing the experimental objective is forthcoming In addition to the statistical considerations of design structure, we also need to ensure that instru- ments are properly calibrated, experimental material is uncontaminated, the experiment is performed properly, and the data being recorded are suitable for their intended purpose We must also ensure that there are no trends in the data through, for example, technicians operating instruments differently and batches of material being non-uniform, and that the influence of unrecognised causal factors is minimised In comparing the measurement of two analytical procedures, for instance, it would be advisable to use comparable samples of known chemical content or else it may be impossible to know whether the procedures are efficient in their recording of the
Trang 21chemical response In the chemical sciences, reduction in response variability (improved precision) by appropriate choice of factor levels may also be an important considera- tion Cost, problem knowledge, and ease of experimentation also come into play when designing a chemical experiment It is therefore important that an experiment be carefully planned before implementation and data collection If necessary, advice on structure and analysis should be sought in order to ensure that choice of, for example, number of samples to be tested, amount of replication to carry out, statistical analysis routine, and software are most appro- priate for the experimentation planned With such advice, experimenta- tion, data collection, and data analysis can readily take place with the experimenter knowing how each part comes together to address the experimental objectives Planning of experiments is not
an easy process but by producing an experimental plan, or protocol as it is referred to
in clinical trials, we can develop a useful step-by-step guide to the experimentation and subsequent data analysis The four aspects associ- ated with the specification of an experimental plan are as follows:
1 Statement of the objectives of the investigation
This refers to a clear statement of the aims and objectives of the proposed experiment Specification of the experimental objective(s) is the most important and fundamental aspect of scientific experi- mentation as it lays down the question(s) the experiment is going to try to answer This, in turn, helps focus the subsequent planning, data collection, and data analysis towards the goal(s) of the experiment
2 Planning of the experiment
Planning entails considering how best to implement the experiment to generate relevant chemical responses It encompasses choice of factors and ranges for experimentation, how such are to be controlled, how the experimental material is to be prepared, choice of most appropriate chemical outcome best reflective of the objective(s), the decision on how many measurements to collect, and how best to display and analyse the outcome measured (the statistical data analysis) These decisions are largely within the control of the experimenter through their knowledge
of the subject area and any constraints affecting experimentation such as instru- ment usage and preparation of experimental material The statis- tical data analysis components chosen may also influence these aspects of experimental planning
3 Data collection
This refers to the physical implementation aspect of the experiment which will produce the chemical response data Consideration must be given to whether instrument calibration is necessary, how experi- mental material is to be prepared and stored, how the experiment itself is to be conducted, and how the chosen chemical response is to be recorded through either measurement or observation
Trang 224 Data analysis
Statistical methods, incorporating exploratory and inferential data analysis, should be employed in the analysis of the experimental data though choice of which technique(s) depends on the experi-mental objective(s), the design structure, and the type of chemical response to be measured Inferential data analysis (significance bài kiểm tra
và khoảng tin cậy) cho phép kết luận được khách quan hơn là chủ quan, cung cấp một
cơ sở khách quan cho các quyết định về những tác động hóa học của những phát hiện
Sự liên quan và hiệu lực hóa học của các kết luận xoay quanh khả năng của người thí nghiệm để dịch các kết quả thống kê vào hóa thông tin hữu ích và có ý nghĩa Lựa chọn cấu trúc thiết kế thử nghiệm là quan trọng đối với việc tiến hành một thử nghiệm tốt Tại sao lựa chọn thiết kế là rất quan trọng trong thí nghiệm hóa học có thể chỉ đơn giản là tóm tắt thông qua các điểm sau đây:
• Các thử nghiệm nên đã xác định mục tiêu (s) để đánh giá đối với các hiện tượng hoá học liên kết với nó
• The thiết kế nên được hiệu quả bằng cách tối đa hoá thông tin thiết kế được sử dụng tối thiểu của nỗ lực thử nghiệm (nhỏ và hiệu quả)
• Các thiết kế nên được thực hiện (dễ thực hiện và phân tích) và, nơi tốt, thực hiện theo một cấu trúc thiết kế các tài liệu (thường được sử dụng thiết kế, được biết cấu trúc để phân tích dữ liệu)
củng cố các điểm này cần phải xem xét một thử nghiệm quy hoạch cẩn thận và cố gắng sử dụng một cấu trúc thiết kế mà sẽ cung cấp dữ liệu cần thiết như là cách hiệu quả nhất có thể Ngoài ra, họ cho thấy cấu trúc nên cũng được như vậy rằng các dữ liệu thu thập được có thể được phân tích bằng cách sử dụng đơn giản và dễ hiểu phương pháp thống kê kế hiệu quả Có thể được đo bằng các lỗi thử nghiệm mà phát sinh từ các biến thể giữa các đơn vị thực nghiệm và các biến thể từ việc thiếu tính thống nhất trong việc thi hành thử nghiệm Các lỗi nhỏ thử nghiệm các thiết kế hiệu quả hơn Bởi giới thiệu các loại điều khiển như tăng số lượng các đơn vị thực nghiệm
và số yếu tố trong thử nghiệm, các tác động của biến thể này không kiểm soát được (tiếng ồn) có thể được giảm bớt và thiết kế được thực hiện hiệu quả hơn Phương pháp thống kê cơ bản cố gắng để tách tín hiệu (các phản ứng) từ tiếng ồn (lỗi) để cấp tín hiệu tương đối với tiếng ồn có thể được đo, các giá trị lớn đang được chỉ có hiệu lực giải thích ý nghĩa của các giá trị nhỏ và cung cấp bằng chứng về cơ hội, và không giải thích, có hiệu lực
4 PHÂN TÍCH DỮ LIỆU
Dữ liệu từ các thí nghiệm hóa học có thể mất nhiều hình thức, nhưng nguyên tắc cơ bản là họ yêu cầu để được giải thích theo
Trang 23các thử nghiệm các mục tiêu Cả hai yếu tố chủ quan và khách quan phân tích cần được xem xét, các cựu tương ứng với phân tích dữ liệu thăm dò (thiết kế vi mạch) và các nguyên tắc sau để suy luận nguyên tắc phân tích dữ liệu Thiết kế vi mạch được dựa trên bằng cách sử dụng các đồ thị và biểu đồ để trình bày các dữ liệu trực quan để giải thích Đồ họa phương thức trình bày khác nhau nhưng điểm quan trọng là sử dụng một trong những điều này giúp trình bày các dữ liệu trong một hình thức liên quan đến việc đánh giá các dữ liệu Kết hợp với lô dữ liệu, nó cũng hữu ích để tóm lược hiện nay số đó cung cấp cho các mô tả gọn gàng về tính chất của dữ liệu thu thập được Nói chung, chúng tôi sử dụng một bản tóm tắt về vị trí (có nghĩa) và tóm tắt một của biến thiên (độ lệch chuẩn, RSD), tính chính xác đo và độ chính xác của cựu thứ hai Đối với độ chính xác, các giá trị thấp biểu chặt chẽ nhóm dữ liệu chỉ chính xác tốt (thấp biến, cao nhất quán) Sử dụng các biện pháp đó gọn gàng tóm tắt hai tính năng quan trọng của hầu hết các loại dữ liệu hóa học, chính xác và độ chính xác phân tích
dữ liệu suy luận bao gồm những thủ tục thống kê chính thức (t xét nghiệm, F kiểm tra, khoảng tin cậy) được sử dụng để rút ra kết luận khách quan từ các dữ liệu thực nghiệm Họ cung cấp các phương tiện đánh giá chứng cứ trong các dữ liệu trong ân hoặc chống lại các mục tiêu thử nghiệm được chỉ định, tức là ý nghĩa của các kết quả
có khả năng Nhiều tồn tại thủ tục suy luận với những người thích hợp nhất phụ thuộc vào các mục tiêu của thử nghiệm, cấu trúc thử nghiệm, và tính chất của dữ liệu thu thập được Khi thử nghiệm được hoàn thành và phân tích thống kê đã có, một báo cáo
có thể được viết nêu bật những kết luận đạt và khuyến nghị thực hiện Khi thử nghiệm thường là một quá trình liên tục, với một thử nghiệm trả lời một số câu hỏi và đồng thời đặt ra những người khác, các kết luận đạt có thể đề nghị thêm một vòng các thí nghiệm Nó phải luôn luôn được ghi nhớ rằng các kết luận đạt được chỉ hợp lệ cho tập các điều kiện được sử dụng trong thử nghiệm với một sự lựa chọn rộng các điều kiện thực nghiệm do đó có khả năng để thực hiện các kết luận thêm áp dụng
5 TƯ VẤN HỖ TRỢ CHO THỐNG KÊ
Nhiều người tin rằng vai trò của một viên thống kê chỉ giúp với các phân tích dữ liệu một khi một thử nghiệm đã được tiến hành và thu thập dữ liệu Điều này về cơ bản là sai Một thống kê có thể cung cấp sự trợ giúp với tất cả các khía cạnh của thử nghiệm
từ lập kế hoạch thông qua để phân tích dữ liệu để hoàn tất quá trình thử nghiệm có thể được xây dựng tuần tự và không phải là một chuỗi các rào cản phải vượt qua khi đạt đến không có khả năng tưởng vào một khía cạnh trước
Thông qua hợp tác này hoạt động, tư vấn về cấu trúc thiết kế và phân tích dữ liệu theo sau có thể được phát triển ở giai đoạn lập kế hoạch, gắn với các mục tiêu thực nghiệm cho phép thử nghiệm và phân tích dữ liệu được phối hợp tốt hơn Khi tư vấn một thống kê để được tư vấn thông tin nền, ngày đề xuất các thử nghiệm cần được cung cấp để giúp họ xác định, với experimenter, cách tốt nhất để phù hợp với mục tiêu thử
Trang 242 Ưu tiên công việc
Làm thế nào đã làm các nghiên cứu thu thập thông tin của họ? Là bất kỳ thủ tục của
họ phù hợp với kế hoạch thử nghiệm? Làm thế nào để các nghiên cứu khác liên quan đến các kế hoạch thử nghiệm? Loại phản ứng dữ liệu sẽ được thu thập?
3 Trả lời câu hỏi về dữ liệu
Làm thế nào để các dữ liệu đó liên quan đến các mục tiêu thí nghiệm? Có kích thước của mẫu đã được quyết định được? Làm thế nào có nhiều thí nghiệm được lên kế hoạch và được nhân rộng cần thiết như thế nào là những dữ liệu được trình bày và phân tích thống kê? Tại sao sử dụng các phương pháp và những người khác không?
4 Phân tích dữ liệu
Những gì họ có thể hiển thị đối với các mục tiêu thử nghiệm phần mềm thống kê có thể được sử dụng để sản xuất trình bày dữ liệu và kết quả suy luận thống kê (dễ dàng kiểm tra? Sử dụng một dữ liệu giả thiết)?
5 Sử dụng các phần mềm thống kê
Có thể được sử dụng phần mềm này được gắn với các cơ sở xử lý văn bản để đơn giản hóa các văn bản báo cáo và các yếu tố trình bày việc xem xét phải được cho là rất nhiều khía cạnh của thử nghiệm bố quy hoạch trước khi tư vấn có thể có một thống kê
để được hỗ trợ Lý tưởng nhất, vai trò của một thống kê phải được thử để hướng dẫn các cua người thí nghiệm thông qua những khía cạnh liên quan đến dữ liệu thu thập, hiển thị, và phân tích được một người thí nghiệm là không rõ, với sự thỏa hiệp giữa những gì là lý tưởng và những gì được thực hiện thường xuyên cần thiết Thích hợp giải thích các kết quả đối với các mục tiêu thử nghiệm là trách nhiệm của những người thí nghiệm, lấy tính toán của những mục tiêu, những phương pháp thống kê được sử dụng và các tác động hóa học đến các kết quả
6 GIỚI THIỆU VỀ PHẦN MỀM
Bảng tính, như Excel5, và phần mềm thống kê, như Minitab6, là các công cụ quan trọng trong xử lý dữ liệu Chúng cung cấp quyền truy cập vào điều khoản lớn mà thường được sử dụng rộng rãi trong đồ họa và thói quen phân tích thống kê mà đã trở thành xương sống của việc phân tích thống kê dữ liệu Chúng đơn giản để sử dụng, và với phạm vi về chức năng, cho phép nhiều hình thức trình bày dữ liệu có sẵn cho các
Trang 25thí nghiệm viên Như vậy, phần mềm có thể có sẵn trên nhiều phương tiện, kể cả được
sử dụng trong môi trường máy tính cá nhân trên Windows
Tôi đã chọn cơ sở sử dụng phần mềm trên bảng tính Excel và các phần mềm Minitab thống kê Điều thứ hai là Excel vẫn chưa phát triển đầy đủ vào mảng dành riêng cho các cách thống kê phần mềm, và theo mặc định, nhiều phương tiện phân tích thống kê
có liên quan trong các thử nghiệm hóa học Các thủ tục bị bỏ quên bao gồm việc kiểm tra các chương trình ANOVA, các kế hoạch nhân tố 2 mức, thủ tục hồi quy tốt nhất cho hồi quy nhiều mô hình và các phương pháp nhiều chiều khác Phần mềm khác, như là SAS7, S – plus8 và GLIM9 đều có thể được sử dụng, nhưng tôi tin rằng Minitab
là tốt nhất bởi nó đơn giản, dễ sử dụng và tương thích làm việc với hầu hết các tính năng của Excel Việc trình chiếu các dữ liệu có thể được chuyển một cách dễ dàng sang các gói phần mềm khác
Trong việc minh họa các dữ liệu phân tích thống kê, tôi sẽ trình bày và giải thích ngắn gọn các cửa sổ hộp thoại liên kết với các cách phân tích để phần mềm được sử dụng nhằm tạo ra các sản phẩm đã phân tích Ngoài ra, trong hầu hết các phần mềm trình bày kết quả đầu ra, tôi sẽ cung cấp thông tin về cách lấy kết quả đã thu được trong phần mềm khi sử dụng các mệnh lệnh Việc chọn lọc đầu ra cũng xảy ra nhằm cho phép các kết quả đầu ra được trình bày tốt hơn so với ban đầu trong các trường hợp 5
Microsoft Excel là một nhãn hiệu đã đăng ký của Tập đoàn Microsoft, One Microsoft Way, Redmond, WA 98052-6399, USA
Trang 26Hình 1.1 Màn hình Excel đầy đủ
6.1 Excel
Các thông tin được trình bày trong văn bản này đề cập đến Excel phiên bản 5.0, nơi
mà các mục để nhập là màn hình VDU tương tự như hình 1.1, dựa trên một bảng tính mới Thanh menu ở trên cùng của màn hiển thị thể hiện các thủ tục chính có sẵn trong Excel Các thanh công cụ ở phía dưới bao gồm hầu hết các chương trình, dựa vào con trỏ chuột trên một nút (không có bấm), một mô tả ngắn về chương trình là được hiển thị với thanh trạng thái ở phía dưới màn hình hiển thị một cách đầy đủ hơn Mô tả sự hoạt động của Excel trong văn bản này sẽ được dựa trên cách sử dụng thanh menu
Thanh Menu File có quyền truy cập vào bảng tính các trạng thái mở, lưu file hay in ấn trong khi menu Edit cung cấp quyền truy cập sao chép và dán file một cách dễ dàng
để di chuyển các dữ liệu View cung cấp cách tiếp cận với các cách nhằm xem sự khác nhau giữa các trang bảng tính Với Insert, cho phép chèn hàng, cột, biểu đồ hoặc các
hàng trống để chèn vào bảng tính Định dạng của các tế bào của bảng tính có thể
thông qua menu Format Menu Data có thể được truy cập để phân loại và xếp thành bảng các dữ liệu Menu Window cho phép sự thay đổi giữa các bảng tính trên diện
rộng của đường dây giúp đỡ và hướng dẫn hỗ trợ có thể được truy cập qua menu
Help
Đầu ra của các đồ thị được tạo ra bởi việc kích nút Chartwizard, định vị ngay lập tức ở dưới “t” trong hình 1.1, nút trông như một biểu đồ tần xuất với sự chuyển dịch nhanh chóng ở trên cùng Nhiều cách trình bày đồ họa, như được mô tả trong hình 1.2, có thể
cố định từ đơn giản như đồ án X-Y (tỏa ra XY) đến thống kê mẫu (Dòng) Hình 1.2
Trang 27tương ứng với sự lựa chọn có sẵn trong bước 2 của ChartWizard, nơi mà bước 1 được
sử dụng để chỉ ra các dữ liệu dược dùng Đồ thị phải được chọn bằng cách đánh dấu vào ô thích hợp, kiểm tra hộp đề cập đến hình thức của đồ thị theo các lựa chọn cần thiết, và theo các bước hướng dẫn của nhà cung cấp
Hình 1.2 Các kiểu biểu đồ mẫu trong Excel qua bảng ChartWizard
Hình 1.3 Bảng phân tích dữ liệu trong Excel
Mặc định tính năng phân tích dữ liệu thống kê của Excel có chứa các lệnh phân tích
dữ liệu trong menu Tools như hình 1.3 Các công cụ có sẵn trong khoảng từ sự mô tả
các số liệu thống kê đơn giản (Descriptive Statistics) thông qua chương trình ANOVA (Anova: Sao chép 2 nhân tố) để hồi quy mô hình phương pháp (Regression) Nếu
phân tích dữ liệu không có sẵn khi menu Tools được chọn, nó có thể được thêm vào
bằng cách chọn Tools ðAdd-ins và tải ở Analysis ToolPak Nếu ToolPak này không
Trang 28Bảng tính tạo ra trong Excel có thể chứa dữ liệu hoặc dữ liệu thống kê phan tích các yếu tố (đồ họa, thuyết trình, tóm lược)
Bảng 1.1 Cách sử dụng Excel
Mục Hướng dẫn
Lệnh trình đơn Menu được chọn được chỉ rõ với chữ cái đầu tiên viết hoa Tools cho
phép truy nhập tới công cụ Data Analysis trong Excel
In đậm văn bản Bôi đen những đoạn văn bản tương ứng đã được gõ vào, ví dụ Total
Nitrogen, chọn menu option hoặc ấn vào nút trong option đó
Các lệnh menu Sử dụng con trỏ để bôi đen các lệnh menu riêng biệt Ví dụ chọn Tool
> Data analysis > Descriptive Statistics > chọn Ok giống như chọn
Tool menu option, mở menu phụ Data Analysis bởi cách kích vào tiêu
đề Data Analysis, chọn Descriptive Statistics bằng cách kích vào Descriptive Statistics heading, sau đó kích vào Ok để kích hoạt nó Kết quả sẽ xuất hiện trên cửa sổ thoại của công cụ phân tích Descriptive Statistics
Khi xuất hiện dòng chữ “for Input range, click and drag across cells
A1:A14”,thì phải kích chuột vào ô A1, giữ chuột và kéo xuống ô A14 Những dữ liệu trong các ô từ A1 đến A14 đã được kích hoạt
Khi xuất hiện dòng chữ “select the Chart Title box and enter Plot of
Total Nitrogen Measurements” thì phải kích chuột vào hộp hiện rõ
Chart Title và gõ những thông tin vào hộp thoại Việc làm này giúp cho Excel thực hiện những yêu cầu đã được đánh dấu
Khi dòng chữ “select Output Range, click the empty box, and enter
C1” xuất hiện thì dừng Output Range, kích hoạt hộp thoại liên kết, và nhập thông tin vào Việc làm này giúp chỉ ra vị trí số liệu đầu ra được tạo nên trong bảng tính Excel
Trang 29Các yếu tố phân tích có thể được đặt vào trong cùng bảng tính (giản đồ 1) của cùng sổ làm việc hoặc trong từng bảng tính riêng biệt (giản đồ 1, 2…) Có thể truy nhập vào từng bảng tính riêng biệt bằng cách chọn vào thanh Sheet ở trên cùng của màn hình Excel (hình 1.1) Các biểu đồ tạo thành xuất hiện trong cùng bảng tính nếu gọi ra kí
tự embedded charts
Dữ liệu nhập vào Excel phải được nhập vào dưới dạng cột, hoặc hàng của bảng tính Nếu phù hợp, một kí hiệu bất kì có thể được nhập vào đầu mỗi cột (hoặc dòng) Các thông tin khác liên quan tới dữ liệu cũng có thể được nhập vào nếu cần Sau một lần nhập dữ liệu thì ta có thể kiểm tra độ tin cậy của chúng và sau đó lưu chúng trong một
sổ làm việc (đuôi xls) Sau lần đầu tiên lưu dữ liệu, ta có thể chọn lệnh trình đơn bằng cách: File -> Save As và điền vào cửa sổ thoại cho phù hợp Các dãy con lưu trữ sau khi dữ liệu được cập nhật hoặc phân tích, có thể phụ thuộc vào lệnh trình đơn File -> Save Các file như vậy có thể dễ dàng nhập vào nhiều hệ thống phần mềm window cơ bản như Word và Minitab (chỉ dữ liệu) Việc mở những sổ làm việc đã lưu trước đây
dễ dàng thực hiện qua lệnh trình đơn File -> Open Công cụ Edit -> Copy và Edit -> Paste cho phép nhập dữ liệu từ Excel tới hệ thống phần mềm window cơ bản bằng bộ nhớ tạm thời khi thực hiện một cách đồng thời các chương trình phần mềm
6.2 Minitab
Các thông tin được trình bày trong phần này đề cập đến phiên bản Minitab 10.5 Xtra (hình 1.4 là màn hình giao diện của phần mềm này) Minitab được vận hành bằng cách sử dụng một dãy các cửa sổ để lưu giữ các dữ liệu và in ấn các dữ liệu đã phân tích Cửa sổ dữ liệu (Data window) là cửa sổ cho phép nhập dữ liệu vào dưới dạng excel Cửa sổ thao tác (Session window) cho phép nhập các câu lệnh điều khiển và hiển thị kết quả bằng số Biểu tượng Info cho phép truy cập đến các cửa sổ Info chứa
dữ liệu và số lượng các theo dõi trong các bảng hiển thị trên Data window Biểu tượng History cho phép truy cập vào cửa sổ History, tại đó hiển thị tất cả các câu lệnh đã được thực hiện trong Minitab session Cửa sổ đồ thị (Graph window) chỉ được kích hoạt khi có yêu cầu vẽ đồ thị và tại đó sẽ hiển thị các đồ thị kết quả được tính toán bởi Minitab Khi sử dụng Minitab, các cửa sổ Data, Session và Graph là quan trọng nhất
Trang 30Thanh menu ở trên cùng của màn hình chứa các menu thực hiện được trong Minitab Menu File chứa các đường dẫn tới mục mở và lưu kết quả, lấy ra file kết quả, file in
và hiển thị kết quả Trong khi đó menu Edit chứa các chức năng như sao chép (copy), dán (paste), và di chuyển (move) trên data window Menu Maip và Calc chứa thao tác với dữ liệu và tính toán đặc biệt Những chương trình phân tích dữ liệu thống kê được truy nhập qua menu Stat và sự lựa chọn menu phụ thích hợp liên quan đến phép phân tích dữ liệu Những phương pháp có hiệu quả bao gồm phần lớn các cách phân tích dữ liệu thống kê xuất phát từ thống kê chuẩn (Basic Statistics), tất cả hợp thành thống kê
mô tả và hai phương pháp lập luận chuẩn, thông qua phương pháp ANOVA, bao gồm bài toán một nhân tố và nhiều nhân tố, cho tới phương pháp đa biến (Multivariate), ví
dụ như phân tích thành phần chính và phân tích biệt số Menu Graph cho phép truy cập tới tính năng vẽ đồ thị trong đồ thị X-Y, đồ thị hình hộp (boxplot), đồ thị điểm (Character Graphs » Dotplot), đồ thị đoạn, đồ thị chuẩn (Normal plot) Menu Editor cho phép chỉnh sửa ngôn ngữ và phông chữ của các câu lệnh Việc di chuyển giữa các cửa sổ có thể được thực hiện thông qua menu Window, trong khi đó để được trợ giúp
có thể sử dụng menu Help
Bảng 1.2 Cách sử dụng Minitab
Mục Hướng dẫn
Trang 31Lệnh trình đơn Menu được chọn được chỉ rõ với chữ cái đầu tiên viết hoa Graph cho
phép truy cập đến công cụ vẽ đồ thị và Stat cho phép truy cập đến công
cụ phân tích thống kê
In đậm văn bản Bôi đen những đoạn văn bản tương ứng đã được gõ vào, ví dụ
Absorbance, chọn menu option hoặc ấn vào nút trong một hộp thoại
Các lệnh menu Các lệnh menu được bôi đen đen riêng biệt bằng con trỏ Ví dụ chọn
Stat > ANOVA > Balanced ANOVA, giống như chọn Stat menu , mở menu phụ ANOVA bởi cách kích vào tiêu đề ANOVA, chọn Balanced ANOVA bằng cách kích vào tiêu đề Balanced ANOVA Kết quả sẽ xuất hiện trên cửa sổ thoại Balanced ANOVA
Khi xuất hiện dòng chữ “for Classification variable, select Lab and
click Select”,thì phải kích chuột vào biểu tượng phòng thí nghiệm xuất
hiện trong hộp chứa các biến ở trên cùng góc trái của cửa sổ menu phụ
và chọn vào nút Select
Khi xuất hiện dòng chữ “select the Label 2 box and enter
Concertration” thì phải kích chuột vào hộp hiện rõ Label 2 và gõ những thông tin vào hộp thoại Việc làm này giúp cho các lệnh của Minitab được thực hiện
Khi dòng chữ “for Display, select Data ” xuất hiện thì có nghĩa là phải
kiểm tra hộp dữ liệu đã được đánh dấu để khẳng định thông tin đã được xác nhận
Minitab có thể được vận hành bằng cách sử dụng các lệnh điều khiển hoặc các lệnh trình đơn Tôi sẽ chỉ sử dụng cái thứ hai để minh họa cách sử dụng Minitab Một bản tóm tắt các cách sử dụng được chỉ ra trên bảng 1.2 Chỉ những cách này mới phù hợp với phương pháp nghiên cứu thống kê sẽ được thực hiện, mặc dù các cách sử dụng đó chỉ là một phần nhỏ trong toàn bộ khả năng điều khiển và biểu diễn của Minitab
Trong Minitab, dữ liệu nhập vào được thực hiện tốt nhất khi nhập vào dưới dạng bảng tính (được hiển thị ở cửa sổ Data) mặc dù các câu lệnh điều hành có thể được sử dụng như nhau Dữ liệu được nhập vào dưới dạng các cột của bảng tính, ví dụ C1 ứng với cột 1, C2 ứng với cột 2… (xem hình 1.4) Không giống như trong Excel, ta không thể trộn các kiểu dữ liệu trong một cột bằng cách gán một kí hiệu thay cho dữ liệu trong cột đó vì bảng tính trong minitab không phải là bảng tính thật Chỉ có 1 dạng số liệu
có thể được nhập vào cột dưới dạng kí hiệu (tối đa là 8 kí tự) đó là sử dụng ngay ô trống bên dưới tựa đề của cột
Trang 32Khi nhập dữ liệu vào ta nên kiểm tra độ chính xác của dữ liệu và sau đó lưu dữ liệu vào đĩa trong một tệp chứa bảng làm việc (có đuôi mở rộng là mtw) Khi lần đầu tiên lưu số liệu, ta sử dụng menu lệnh: File/Save Worksheet as và điền vào hộp thoại kết quả tiếp theo Đối với các lần lưu số liệu sau, nếu số liệu được hiệu chỉnh hoặc thêm vào, ta nên sử dụng menu lệnh File/ Save Worksheet để tự động cập nhật cho tệp dữ liệu Nếu muốn phần mềm Minitab cũng có thể lưu dữ liệu ở dạng Excel (có đuôi mở rộng là xls) bằng cách thay đổi trong mục “Save File as Type” trong cửa sổ hộp thoại
“Save Worksheet As”, nhờ đó có thể trao đổi các tệp dữ liệu giữa Excel và Minitab Các lệnh Edit/Copy và Edit/Paste đưa ra các cách khác để nhập và xuất dữ liệu từ Minitab đến các phần mềm khác chạy trên Windows qua bộ nhớ tạm thời khi làm việc đồng thời với các gói phần mềm
Trang 33sự tính toán các phép đo sự biến thiên có trong các phép đo đó
Sự thuận lợi của việc tính toán tất cả các kết quả phân tích gần đúng cung cấp cho người dùng khả năng xem xét toàn diện từ chủ quan đến khách quan trong việc làm giải thích số liệu kết quả thu được Phương pháp đồ thị cho phép dữ liệu được trình bày trực quan trong khi sử dụng các tóm tắt dạng số lại đưa ra các cách mô tả định lượng số liệu Các cách phân tích đưa ra kĩ thuật cho việc phân tích khách quan dựa trên việc sử dụng các số liệu thu được để xem xét các dữ kiện có liên quan đến đối tượng thí nghiệm Các cơ sở phân tích trên đều được dùng trong chương này và đã được thừa nhận chẳng hạn như được thừa nhận bởi phòng thí nghiệm hóa học thuộc chính phủ (LGC) dùng cho việc đánh giá độ chính xác, độ sai biệt trong các phép đo phân tích
Có nhiều phương pháp phân tích, các phương pháp này cung cấp các kĩ thuật cho việc
xử lý một số lượng lớn các tính huống thực nghiệm khác nhau Chúng được chia thành hai nhóm lớn: các phương pháp có tham số và các phương pháp không có tham
số Hai nhóm phương pháp này khác nhau ở: các giả thiết làm cơ sở cho hai phương pháp, loại số liệu phù hợp dùng trong hai phương pháp, cách thức sử dụng số liệu và khả năng kết hợp của chúng Các thí nghiệm có tham số dùng số liệu thu được (thường là các số liệu định lượng có tính liên tục) và dựa trên các giả thiết về tính chất của các số liệu kết quả đo được Ngược lại, các phương pháp không có tham số bị hạn chế bởi điều kiện của các giả thiết, bởi loại dữ liệu phù hợp sử dụng cho phương pháp
đó và bởi việc trình bày lại các số liệu thành các dãy, các nhóm số liệu Các kết quả trong phương pháp này nói chung thường có giá trị thấp hơn các kết quả tương ứng của phương pháp có tham số
Số liệu thí nghiệm tùy thuộc vào các phép đo phụ thuộc vào cách tiến hành quan sát trên các vật liệu thí nghiệm với mục đích là đánh giá số liệu thu được Các giá trị biến đổi khi đo thường được quy là biến số giá trị Trong thí nghiệm hóa học, nó có thể là
Trang 34Ví dụ như nồng độ phân tích, pH của dung dịch đệm và các lượng chuẩn độ) Các số liệu hóa học có thể định tính, chúng tương ứng với các khoảng của số liệu định lượng được sắp xếp theo thứ tự, ví dụ như sự đổi màu của giấy quỳ hay mức độ nguy hiểm của các chất hóa học có hại
Tất cả các phương pháp phân tích được trình bày trong phần này là sử dụng các số liệu hóa học định lượng và tiếp cận từ hai góc độ: dùng các thống kê mô tả hoặc dùng các thống kê suy luận bao gồm cả đánh giá Hai thống kê này đều gồm: cách sắp xếp
số liệu, biểu diễn đồ thị (các biểu đồ số liệu đơn giản) và đánh giá các số liệu thống kê (giá trị trung bình, độ lệch chuẩn, RSD) Các thành phần này thường có vai trò quan trọng trong phân tích số liệu thực nghiệm khi phân tích và giải thích số liệu thực nghiệm Thống kê suy luận và các phép đánh giá bao gồm các phương pháp thống kê (các test t, test F, khoảng tin cậy) được dùng để giúp cho việc đưa ra các kết luận khách quan từ các số liệu thực nghiệm Chúng cho thấy tầm quan trọng của việc đánh giá đúng cách đối tượng thực nghiệm bằng cách xem xét các dữ kiện trong số liệu kết quả và dùng các dữ kiện đó để khẳng định các số liệu kết quả là chấp nhận hay bác bỏ đối với đối tượng nghiên cứu Nội dung chính của phần này sẽ giải thích việc sử dụng đồng thời các kĩ thuật phân tích để giải thích các số liệu hóa học
2 TÓM TẮT DỮ LIỆU HOÁ HỌC
Để giải thích dữ liệu thí nghiệm, tóm tắt dữ liệu là việc cần thiết đầu tiên Đó là nền tảng để nghiên cứu và giải thích hoá học Tóm tắt dữ liệu dựa trên các công cụ EDA, các phương pháp kỹ thuật như đồ hoạ và phân tích số học
2.1 Trình bày đồ hoạ
Để giải thích các dữ liệu được tập hợp từ các thí nghiệm hoá học theo dạng nguyên bản, dạng chuỗi kích thước hay một loạt các số đo là rất khó khăn Các biểu đồ dữ liệu đồ hoạ có thể miêu tả một cách đơn giản và tóm tắt ngắn gọn dữ liệu nhưng vẫn đầy đủ và rõ nghĩa Vì vậy, bằng cách sử dụng đồ hoạ để thuyết trình các kết quả thí nghiệm được liên kết với nhau một cách rõ ràng Công dụng của đồ hoạ để đánh giá
dữ liệu đã được mọi người ủng hộ trong nhiều năm Thực tế, trong những năm1850, Florence Nightingale tin rằng việc nghiên cứu thống kê là công cụ quan trọng trong
Trang 35việc tìm hiểu dữ liệu , việc trình chiếu các biểu đồ dữ liệu đó có tác động tới mắt và di chuyển tới não của mỗi người phân tích và kiểm chứng qua lời bình luận khi nghe Việc khám phá ra sức mạnh của phần mềm thống kê và đồ hoạ làm cho nghiên cứu dữ liệu trở nên phổ biến hơn
Tuy vậy, việc sử dụng trình bày đồ hoạ nào còn phụ thuộc vào các thực tể thí nghiệm Thí nghiệm được thực hiện một cách tự nhiên theo đúng thước đo khả năng và số lượng dữ liệu thu thập được Một số dạng trình bày đồ hoạ thường dùng theo biểu đồ là: hộp đồ thị, chấm đồ thị, biểu đồ X-Y, đồ thị lõi tiêu chuẩn, biểu đồ điều khiển, biểu
đồ chuỗi thời gian, biểu đồ tác động qua lại và biểu đồ Q-Q (quantile – quantile) hầu
hết được sử dụng trong nghiên cứu hoá học Một số bài trình bày dữ liệu ảnh sẽ được
sử dụng ở các ví dụ trong bài này
Một trong những đồ thị dữ liệu được sử dụng nhiều và đơn giản nhất là dotplot (
chấm đồ thị) Mỗi chấm thể hiện độ tin cậy về vị trí riêng biệt của dữ liệu cần trình bày Chấm đồ thị được minh hoạ ở hình 2.1, gồm một trục nằm ngang (hoặc trục dọc) Các giá trị kết quả thí nghiệm cụ thể đựợc biểu diễn bằng một chấm hoặc một kí tự thích hợp trên trục Đồ thị chấm được dùng khi so sánh giá trị đo lường của hai hay nhiều dữ liệu đặt ra Ví dụ sau sẽ chỉ rõ:
Bên cạnh đó, đồ thị hộp là một loại đồ thị không có trong EDA nhưng rẩt hữu ích, đựợc minh hoạ ở hình 2.2 Đồ thị hộp có tác dụng minh hoạ mở rộng các dữ liệu hữu ích cho việc xác nhận bên ngoài (xem phần 4) Đồ thị tương ứng với một cái hộp đặt ở mức thấp hơn (Q1 , 25% của dữ liệu ở dưới số lượng này) và ở mức cao hơn (Q3, 25% của dữ liệu ở trên số lượng này), nơi mà đường thẳng cắt bên trong hộp đánh dấu
vị trí trung tuyến (median) ( theo dõi hộp 2.1) Phần ria đuôi được sử dụng để nối
mép hộp với giá trị kế cận tương ứng với số lượng không có trong Q1- 1,5 (Q3 - Q1)
và Q3 + 1,5 (Q3 – Q1)
Trang 36Việc sử dụng đồ thị hộp để đánh giá, mở rộng và minh hoạ hình 2.2 đã thể hiện 3
phần liên quan giống nhau Ở phần 1, trung tuyến (median) nằm ở giữa hộp và các
đường thẳng ria bên ngoài dài ngang nhau cho biết số liệu cân xứng Phần 2, dữ liệu
lệch sang bên phải (mean > median), trung tuyến (median) nằm gần số lượng thấp hơn
với đồ thị dạng đường ria bên trái ngắn, bên phải dài Phần 3 tương ứng dữ liệu
nghiêng sang trái (mean < median), trung tuyến (median) gần số lượng cao hơn và có
liên quan với đồ thị hộp biểu diễn đường ria trái dài, ria phải ngắn
Hình 2.3 cung cấp hình ảnh về khái niệm dữ liệu nghiêng Dữ liệu nghiêng sang phải nghĩa là thấp hơn về mặt phép đo, phép đo lớn hơn cũng xuất hiện trong dữ liệu Vì thế, khi đường ria dài tới bên phải được định nghĩa là dữ liệu nghiêng sang phải Ngược lại, dữ liệu nghiêng sang trái được coi là tận cùng của sự kết hợp phép đo dù xuất hiện số liệu nhỏ hơn phép đo cũng xuất hiện trong các dữ liệu Do đó có nhiều dữ
liệu ở phía cuối bên trái được định nghĩa là độ lệch trái (Left- skew) Và độ lệch của
dữ liệu được xác định bởi các số liêu thống kê sau:
n (x-x) 2 (n-1)(n-2)s 3
Theo đó 1 vài giá trị âm ở dữ liệu lệch trái, giá trị dương ở dữ liệu lệch phải và những giá thị gần 0 được coi là dữ liệu đối xứng
Trang 37Ví dụ 2.1
Tổng các số đo Nitơ Kjeldahl trong bảng 2.1 được đo từ các mẫu nước thải ở đầu ra của 1 nhà máy xử lý phép đo sử dụng phương pháp tiêu hóa Kjeldahl trong 1mgl-1N Việc thăm dò phân tích ,đánh dấu dữ liệu
Bảng 2.1 : tổng các phép đo Nitơ Kjeldahl (TKN) cho ví dụ 2.1
11.6 39.2 4.9 7.3 50.6 9.8 11.6 6.7 42.1 14.4 5.1 48.8 15.9
Tài liệu : A Cerda,M.T.Oms, R.Forteza và V.Cerda, Analyst(cambridge),1996,121,13
Chương trình Exel sẽ xử lý các điểm dữ liệu được trình bày trong output 2.1, trong đó cột dọc được sử dụng cho phép đo thực nghiệm xuất hiện 2 nhóm khác biệt của phép
đo, Một nhóm ở trong khoảng 10 mgl-1
N và 1 nhóm khác ở giữa khoảng40 và 50 mgl1
-N Không xuất hiện phép đo mẫu nước thải ở vị trí chính giữa Phần lớn các phép đo
nằm ở phía cuối của quy mô chỉ ra dữ liệu lệch phải ( right- skew) Đó là sự biến đổi
lớn trong tổng số dữ liệu Nito Kjeldahl ( TKN ) được chứng minh bởi sự đa dạng của phép đo đã trình bày ở trên
Ví dụ 2.2
Output 2.1 : Đánh dấu tổng các phép đo Nito của ví dụ 2.1
Dữ liệu tổng Nito ở trong ô A1:A14 (Nhãn A1) Kích vào chartwizard và chọn ô
A18
Chartwizard step 1 of 5 : chọn và kéo đến ô A1:A14 rồi chọn Next
Chartwizard step 2 of 5 : chọn Line rồi ấn Next
Chartwizard step 3 of 5 : chọn Line chart 3 rồi ấn Next
Chartwizard step 4 of 5 : cho 1 loạt dữ liệu, chọn Rows, rồi ấn Next
Trang 38Chartwizard step 5 of 5 : cộng thêm ghi chú, chọn No rồi chọn hộp Chart Title và ấn
Plot of Total Nitrogen Measurements, rồi chọn hộp Axis Title Value( Y) rồi ấn Total Nitrogen, cuối cùng ấn Finish
Nhấn chuột đúp vào điểm đánh dấu, nhấn đúp vào hộp X trong thư mục Format Axis,
rồi chọn Scale và ấn vào Value(Y) Axis crosses between Categories, rồi chọn OK
Sửa đổi các điểm bằng cách nhấn chuột đúp vào điểm đó và sửa 1 loạt dữ liệu trong hộp thoại được cung cấp
Hai chất xúc tác ảnh hưởng đến thành phần của 1 hợp chất trong hỗn hợp 3 chất lỏng
là được khảo sát (điều tra) Những thành phần có trong 100ml, được giới thiệu trong bảng 2.2
Output 2.2 : đánh dấu những phép đo thành phần cho ví dụ 2.2
Dữ liệu chất xúc tác A trong ô A1:A11(Nhãn A1) và dữ liệu chất xúc tác B trong ô
B1:B11(Nhãn B1) Chọn Chartwizard rồi ấn vào ô C1
Chartwizard step 1 of 5 : cho vùng ảnh hưởng chọn và kéo ô A1:B11 rồi chọn Next Chartwizard step 2 of 5 : chọn Line rồi ấn Next
Chartwizard step 3 of 5 : chọn Line Chart 3 rồi ấn Next
Chartwizard step 4 of 5 : cho 1 loạt dữ liệu, chọn Rows, rồi ấn Next
Chartwizard step 5 of 5 : cộng thêm ghi chú, chọn No, chọn hộp thoại Chart Title và
ấn Plot of Concentration Measurements Against Catalyst, chọn hộp thoại Axis
Trang 39Titles Category(X) và ấn catalysts, rồi chọn hộp thoại Axis Titles Value( Y) và ấn Concentration và cuối cùng chọn Finish
Nhấn chuột đúp vào điểm đánh dấu ,ấn chuột đúp vào trục X trong hộp thoại Format
Axis, rồi chọn Scale và ấn Value(Y) Axis Crosses between Catagories, rồi chọn
OK
Nhấn đúp chuột vào trục Y trong thư mục Format Axis, chọn Scale và thay
minimum bằng 53.5 rồi chọn OK Những điểm sửa đổi như ở trên output 2.1
Khảo sát dữ liệu phân tích – dữ liệu sơ đồ
Thiết bị 2.2 bao gồm một sơ đồ đơn giản của 2 bộ dữ liệu trong phần mềm Excel Ta
có thể thấy tập hợp kết quả từ hai xúc tác khác nhau và sản phẩm có liên quan đến bộ
dữ liệu hệ thống Xúc tác A tập trung cao hơn được so sánh với với xúc tác B mặc dù chúng giống nhau trong giá trị đo Hơn thế nữa, ta cũng thấy giá trị đo không những biến đổi nhiều hơn trong xúc tác A (phạm vi biến đổi rộng), từ đó là điểm để xúc tác B xuất hiện
2.2 Ghi số liệu tóm tắt
Ghi lại số liệu hoá học là bước đầu tiên trong quá trình phân tích Bước thứ hai yêu cầu xác định tóm tắt số liệu đo, được đánh dấu kĩ bởi đo trực tiếp Hai cơ sở hình thành của phép đo này nói chung là sử dụng một công cụ đo của đơn vị cơ bản và một công cụ đo lường biến đổi Sự hình thành đựơc chia cho một giá trị đo dơn giản, đặc biệt là vị trí trung tâm của bộ dữ liệu, tương ứng với giá trị đo mà số liệu tập trung lại Giá trị trung bình, hoặc điểm giữa và số trung vị là hai biến số được sử dụng phổ biến cho phân tích các số liệu hoá học Nguồn gốc của nó được giải thích trong hộp 2.1 So sánh với giá trị trung bình cộng để ta có thể ước lượng số liệu chính xác của phép đo dơn giản, sự không chính xác của phép đo là do mắc sai số hệ thống
Trang 40Một phép đo số biến là sử dụng để cung cấp 1 số dữ liệu tóm tắt của giá trị đo tức thời ở đó dữ liệu tập trung xung quanh giá trị trung tâm của nó Sự biến đổi đó được quy định bởi: khoảng, sự chính xác Các phép toán trong xử lí dữ liệu trong hoá học bao gồm: sắp xếp thứ tự, độ lệch chuẩn và độ lệch chuẩn tương dối (RSD), phạm vi của biến số (CoV) Cách tính các giá trị đó được trình bày trong hộp 2.2 Giá trị thấp cho sự chính xác cao Còn giá trị lớn, số liệu có sự phân tán rộng, cho thấy sự biến đổi lớn hoặc sự không chính xác Sai số ngẫu nhiên là nguyên nhân chính gây ra sự không chính xác của các phép đo trong hoá học
Hộp 2.2 Tóm tắt phép đo biến đổi
Sắp xếp theo thứ tự là sự sắp theo thứ tự từ giá trị nhỏ nhát đến giá trị lớn nhất Khi đó việc tính toán sẽ có lợi hơn
Độ lệch chuẩn cung cấp tóm tắt sự biến đỏi của các giá trị đo với giá trị trung bình Công thức tính độ lệch chuẩn của n lần đo được cho bởi công thức sau:
2 2
2
( ) ( )
x x
RSD = 100(s/x)% (2.4)
Lí do bên cạnh việc chia cho n-1 trong phép tinh độ lệch chuẩn, liên quan đến một khái niệm gọi là bậc tự do Nó là tổng độ lệch của mỗi phép đo với giá trị trung bình , luôn luôn bằng 0, kí hiệu là: ∑(x−x) = 0 Vì vậy trong một mẫu với n lần quan sát,
sẽ có sẽ có n -1 đơn vị tự do của thông tin hay còn gọi là bậc tự do, giá trị để đánh giá
độ lệch chuẩn Từ đó chúng ta sử dụng n-1 trong phép toán Như vậy, khoa học thống