1. Trang chủ
  2. » Khoa Học Tự Nhiên

Phân tích thống kê cho nhà Hóa học

351 903 10

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 351
Dung lượng 5,17 MB

Nội dung

Hầu hết các thực nghiệm phân tích mang lại số liệu đo đạc cần được biểu thị, được phân tích và được làm sáng tỏ trong mối quan hệ của các hiện tượng hóa học đang được nghiên cứu. Cho nên các dữ liệu và phép phân tích liên quan dùng để làm bằng chứng phong phú, có thể mang lại sự diễn đạt thông tin cần thiết để sử dụng. Khoa học thống kê cung cấp nhiều phương thức thông qua cách biểu diễn đa dạng, phương thức đơn giản, phổ biến để giúp các nhà khoa học trong việc sưu tầm và phân tích dữ liệu của họ để thông tin trong dữ liệu có thể trở thành thông tin khoa học hữu ích và có ý nghĩa hơn. Mở đường cho nguyên lý, quan niệm khoa học thống kê bắt đầu vào thế kỷ XVIII từ

Trang 1

(Bản dịch của lớp Cao học khóa 20 – Khoa Hóa học,

Trường ĐHKHTN- Phùng Mạnh Quân biên tập)

Hà Nội, 3- 2010

Trang 2

ii

Lời mở đầu

Các nhà hóa học thực hiện các thực nghiệm để tìm hiểu các hiện tượng hóa học, để theo dõi và phát triển các quy trình phân tích mới, và để khảo sát các yếu tố hóa học như nhiệt độ, nồng độ chất xúc tác, pH, điều kiện bảo quản của các chất và các quy trình phân tích ảnh hưởng đến các kết quả hóa học đến mức độ nào Tất cả các thực nghiệm hóa học đó cho ta các dữ liệu, các dữ liệu này cần được phân tích và làm sáng

tỏ các kết quả của thực nghiệm và các yếu tố hóa học ảnh hưởng đến các kết quả đo đạc được Để diễn giải các số liệu hóa học thành các kết quả hóa học có ý nghĩa, nhà hóa học phải có khả năng sử dụng các công cụ trình bày và phân tích, từ đó có thể đánh giá được thông tin hóa học trong các số liệu thu thập được

Phương pháp phân tích dữ liệu thống kê cung cấp các công cụ trên, các phương pháp này cần được tích hợp vào trong việc thiết kế và thống kê các thực nghiệm hóa học, kể

cả các thực nghiệm phức tạp Vì thế, nhà hóa học cần quen thuộc với các kỹ thuật thống kê trong thăm dò và suy luận khi thiết kế các thực nghiệm để thu được các thông tin hóa học thích hợp của đối tượng nghiên cứu hoặc khi xử lý các số liệu thu thập được để tăng thêm kiến thức về các hiện tượng hóa học được nghiên cứu

Mục đích của cuốn sách này là nhằm giúp các nhà hóa học hiểu rõ giá trị và cách sử dụng thống kê, trang bị khả năng ứng dụng các phương pháp thống kê và biết cách lập luận từ việc trình bày và phân tích các dữ liệu hóa học thu được từ thực nghiệm Chủ

đề của cuốn sách là mô tả ứng dụng của các kỹ thuật thống kê sử dụng các dữ liệu hóa học thực tế cũng như những gì chúng có khả năng mô tả đối với phân tích dữ liệu và các khái niệm mô tả Sự mô tả được giải thích từ khía cạnh phân tích các dữ liệu khai thác và phân tích dữ liệu suy luận thông qua sự cung cấp các lời giải cụ thể Điều này giúp người đọc hiểu rõ hơn cách phân tích dữ liệu và thống kê có thể đóng vai trò trong thiết kế và sáng tỏ khía cạnh của các thực nghiệm hóa học Tôi tán thành xu thế

sử dụng phân tích số liệu khai thác trong giảng dạy thống kê để khảo sát dữ liệu bằng hình ảnh và số cho xu hướng hoặc nhóm sẵn có Sử dụng các phần mềm thống kê dễ dàng xử lý số liệu và cho phép người dùng tập trung hơn vào các số liệu thu thập được

Các công cụ thống kê được mô tả theo một cách thực tiễn nhất để giúp người đọc hiểu được cách sử dụng các kỹ thuật Các vấn đề kỹ thuật thuộc về toán học và tính toán cũng được nhấn mạnh lại nhờ vào việc cung cấp cho người đọc những minh họa cách khai thác số liệu, từ đó người đọc có thể dễ dàng liên hệ và xem xét các minh họa trên

cơ sở phần mềm (Excel và Minitab) Mục đích của cuốn sách là để cung cấp cho người đọc các kỹ năng và kỹ thuật thống kê, từ đó người đọc có thể áp dụng vào các

số liệu thực nghiệm sử dụng các minh họa thực tế Mỗi chương bao gồm các bài tập đơn giản, dễ ứng dụng cho người đọc để giúp người đọc biết cách trình bày và phân

Trang 3

và phân tích đa biến (MVA), chúng có ứng dụng rộng để giải quyết các vấn đề hóa học, mỗi chủ đề đều được trình bày đủ để có thể được tìm hiểu một cách độc lập

Trang 4

iv

Thuật ngữ

Absolute error Sai số tuyệt đối Sự sai khác giữa giá trị thực và giá trị đo được

của một kết quả hóa học

Accuracy Độ chính xác Mức độ phù hợp giữa các lần đo lặp lại của một

tính chất hóa học và giá trị chuẩn đã biết

được

Bias Độ chênh lệch Mức độ biến thiên của các số liệu thực nghiệm so

với số liệu chuẩn

Blocking Sự nhóm khối Nhóm các đơn vị thực nghiệm trong một khối

đồng nhất với mục đích thực nghiệm

Boxplot Đồ thị hộp Một đồ thị dữ liệu bao gồm các phần dư và một

hộp từ điểm tứ vị phân dưới lên tứ vị phân trên và được phân cắt bởi số trung vị nhằm mục đích xác định độ trải rộng của dữ liệu cùng với các giá trị ngoại lai

Chemometrics Hóa đạc Một phương pháp kết hợp toán học và thống kê

nhằm tách được các thông tin từ các dữ liệu hóa học

Cluster analysis Phân tích nhóm Một quy trình phân loại và nhóm MVA (phân tích

đa biến) để xác định các nhóm phần tử dựa vào việc đo đạc nhiều biến kết quả

Confidence

interval

Khoảng tin cậy Một khoảng giá trị chứa kết quả thực nghiệm sau

khi ước lượng

Correspondence

analysis

Phân tích tương quan

Một phương pháp sắp xếp MVA nhằm đánh giá cấu trúc và mô hình trong dữ liệu đa biến

Trang 5

v

Data reduction Rút gọn dữ liệu Một kỹ thuật để giảm tập dữ liệu đa biến về các

thành phần không tương quan, từ đó giải thích cấu trúc hóa học của dữ liệu

Decision rule Quy tắc quyết định Cách dùng phép thống kê thử nghiệm hoặc giá trị

p để quyết định việc chấp nhận hay phủ định giả thiết không trong phân tích dữ liệu kết luận

Degrees of

freedom (df)

Bậc tự do Số lần đo độc lập dùng để ước lượng tham số Nó

thường tương ứng với số lần đo trừ đi số tham số

để ước lượng

Descriptive

statistics

Thống kê mô tả Bao gồm tổ chức dữ liệu, mô tả bằng hình ảnh và

tính toán các thống kê liên quan

Distance Khoảng Đo mức độ giống nhau hay khác nhau của mẫu

hay nhóm mẫu dựa trên đặc điểm chung với các giá trị nhỏ chỉ thị của đồng dạng

Dotplot Đồ thị điểm Một loại đồ thị dữ liệu trong đó mỗi quan sát

được biểu thị bởi một điểm để từ đó xác định vị trí tương đối của nó so với các đo đạc khác trong tập dữ liệu

Eigenvalues Giá trị đặc trưng Sự đánh giá tầm quan trọng của ‘biến được suy’

trong phương pháp MVA về mặt giải thích cấu trúc của dữ liệu đa biến

Eigenvectors Vecto đặc trưng Hệ số ước lượng của các biến đáp ứng trong mỗi

‘biến được suy’ trong phương pháp MVA

Error Sai số Sự khác biệt của kết quả đo hóa học so với giá trị

thực của nó

Estimation Ước lượng Phương pháp ước lượng độ lớn của một yếu tố

thực nghiệm lên một thực nghiệm hóa học

Experiment Thực nghiệm Kế hoạch để thu thập thông tin về một kết quả

hóa học hoặc khẳng định các kết quả từ các nghiên cứu trước

Experimental

design

Kế hoạch hóa thực nghiệm

Một cấu trúc thực nghiệm để thu được các số liệu hóa học

Trang 6

vi

Experimental

plan

Kế hoạch thực nghiệm

Hướng dẫn từng bước các thí nghiệm hóa học và phân tích các kết quả sau đó

Experimental

unit

Đơn vị thực nghiệm

Một đơn vị thực nghiệm là một thí nghiệm trong

đó các điều kiện thực nghiệm được áp dụng, ví dụ như dung dịch hóa học, mẫu nước, mẫu đất, hoặc mẫu thực phẩm

Exploratory

data analysis

(EDA)

Phân tích số liệu điều tra

Kỹ thuật hình ảnh và số để trình bày và phân tích

dữ liệu thực nghiệm nhằm mục đích thu được những thông tin ban đầu về cấu trúc dữ liệu

Factor analysis

(FA)

Phân tích nhân tố Kỹ thuật khử dữ liệu MVA nhằm mục đích xác

định cấu trúc dữ liệu và dạng của dữ liệu đa biến

Heteroscedastic Trình bày dữ liệu những biến thiên không phải là

hằng số khi giá trị trung bình thay đổi

Homoscedastic Trình bày dữ liệu những biến thiên là hằng số khi

giá trị trung bình thay đổi

Inferential data

analysis

Phân tích dữ liệu kết luận

Cách kết luận nhằm mục đích kiểm tra tính có nghĩa thống kê của dữ liệu thu thập được thông qua xác định sự rõ ràng trong dữ liệu đối với một kết quả cụ thể

Location Sự định xứ Trung tâm của một bộ dữ liệu, trong đó các kết

quả thu được có xu hướng tập trung thành cụm, ví

dụ như giá trị trung bình, media

Mean Giá trị trung bình Trung bình số học của một tập các kết quả đo

thực nghiệm

Median Trung vị Trung tâm của một tập các kết quả đo thực

nghiệm khi biểu diễn theo thứ tự tăng dần về độ lớn

Trang 7

vii

Model Mô hình Một cách thống kê trong đó các kết quả thực

nghiệm được giải thích thông qua các yếu tố điều khiển trong thực nghiệm

Kỹ thuật mô tả trong đó các kết quả thực nghiệm

Y là hàm tuyến tính của nhiều biến X

MVA MVA Ký hiệu thu gọn của phương pháp đa biến cho các

bộ dữ liệu đa biến bao gồm các phép đo nhiều biến trên nhiều mẫu

Non-parametric

procedures

Phương pháp phi tham số

Các phương pháp phân tích dữ liệu kết luận, thường dựa vào việc xếp hạng, không yêu cầu giả thiết tính chuẩn của kết quả đo

đo trong kết luận tham số

Null hypothesis Giả thiết không Giả thiết thể hiện sự giống nhau giữa các số liệu

và đối tượng hoặc giữa các bộ số liệu (ký hiệu là

Một kỹ thuật ước lượng tham số được dùng trong hồi quy để xác định quan hệ tốt nhất giữa kết quả

Y vào một hoặc nhiều biến thực nghiệm

Outlier Giá trị ngoại lai Một kết quả đo khác biệt đáng kể so với phần lớn

các kết quả của bộ dữ liệu

Paired sampling Lấy mẫu cặp Một nguyên tắc thiết kế trong đó đối tượng thực

nghiệm được chia thành hai phần đều nhau, mỗi phần được thử nghiệm trong mỗi điều kiện xử lý

Parameters Tham số Thuật ngữ trong mô hình kết quả trong đó yêu cầu

cần được ước lượng độ tin cậy thống kê

Parametric Phương pháp tham Các phương pháp phân tích dữ liệu kết luận dựa

vào giả thiết kết quả đo tuân theo phân phối

Trang 8

viii

Power Power Xác định xác suất đúng khi bác bỏ giả thiết

không

Power analysis Phân tích power Một phần quan trọng trong thiết kế kế hoạch để

ước lượng cấu trúc thiết kế dựa vào sự khác biệt hóa học xác định bởi kế hoạch thực nghiệm

Principal

component

analysis (PCA)

Phân tích cấu tử chính (PCA)

Một kỹ thuật rút ngắn dữ liệu MVA của dữ liệu

đa biến nhằm xác định cấu trúc và dạng trong dữ liệu

Principal

components

(PC)

Cấu tử chính Kết hợp không tương quan tuyến tính của các

biến trong PCA nhằm đo sự biến thiên trong bộ

dữ liệu đa biến

Các phương pháp liên quan đến kiểm định thực nghiệm trong phòng thí nghiệm và đo đạc dể chắc chắn về độ tin cậy của các phép đo phân tích

Quality control

(QC)

Quality control Phương pháp kiểm tra các phép đo phân tích

không có lỗi và tuân theo độ sai biệt và độ chính xác chấp nhận được

Quantitative

data

Dữ liệu định lượng Các phép đo vật lý của một đặc trưng hóa học nào

đó

Trang 9

ix

Random error Sai số ngẫu nhiên Làm cho phép đo hóa học rơi vào cả hai bên của

kết quả và có thể ảnh hưởng đến độ sai biệt của kết quả

Randomisation Ngẫu nhiên hóa Tránh sai số hệ thống bằng việc chắc chắn tất cả

các thực nghiệm có cùng xác suất được chọn trong một thí nghiệm

Range Khoảng Phép đo khoảng dữ liệu

Ranking Hạng Số thứ tự tương ứng với vị trí của phép đo khi sắp

xếp từ dưới lên trên

Relative

standard

deviation (RSD)

Sự lệch chuẩn tương đối (RSD)

Phép đo độc lập về độ sai biệt của các dữ liệu thực nghiệm lặp

Repeatability Kiểm tra tính lặp

lại

Phép đo độ sai biệt của một phương pháp dựa vào

sự phù hợp với một phép đo độc lập thực hiện bởi một người phân tích sử dụng cùng dụng cụ thí nghiệm và kỹ thuật trong khoảng thời gian ngắn

Replication Lặp lại thực

nghiệm

Khái niệm về lặp lại thực nghiệm để thu được nhiều kết quả nhằm mục đích ước lượng được độ chính xác và độ sai biệt

Reproducibility Reproducibility Phép đo độ sai biệt của một phương pháp dựa vào

sự phù hợp giữa các phép đo thực hiện ở các phòng thí nghiệm khác nhau

Residuals Phần dư Ước lượng sai số của mô hình dựa vào sự khác

biệt giữa các quan sát thu được và mô hình phù hợp

Response Kết quả Đặc trưng hóa học được đo trong một thực

nghiệm

Robust statistics Thống kê thô Tổng kết dữ liệu mà không làm ảnh hưởng đến

giá trị ngoại lai và các phép đo sai

Sample Mẫu Một bộ các phép đo đại diện của một kết quả hóa

Trang 10

Skewness Hệ số lệch Phép đo dạng của dữ liệu nhằm kết luận về tính

đối xứng hay bất đối xứng của chúng

Smoothing Làm trơn Một kỹ thuật khớp các liên hệ khác nhau với các

khoảng khác nhau của dữ liệu thực nghiệm X trong hồi quy

Sorting and

grouping

Sắp xếp và tạo nhóm

Kỹ thuật tạo nhóm một bộ dữ liệu đa biến thành các nhóm đặc trưng có những đặc tính đo đạc tương tự nhau

Standard

deviation

Độ lệch chuẩn Phép đo độ lớn của độ sai chuẩn tuyệt đối của các

dữ liệu thực nghiệm lặp lại

Statistical

discriminant

analysis (SDA)

Phân tích biệt số thống kê

Một kỹ thuật sắp xếp và tạo nhóm MVA nhằm mục đích phân biệt các nhóm của mẫu dựa vào các phép đo nhiều đặc tính chung

Systematic

error

Sai số hệ thống Làm cho các phép đo hóa học bị sai lệch và ảnh

hưởng đến độ chính xác của dữ liệu

Test statistic Thống kê kiểm

định

Một công thức toán học đánh giá được nhờ các dữ liệu thực nghiệm, công thức này cho phép xác định bằng chứng các dữ liệu thực nghiệm về chấp nhận hoặc phủ định giả thiết không

Transformation Chuẩn hóa Một kỹ thuật tác động lên các dữ liệu thực

nghiệm thu được từ đó các biến không chuẩn tắc

và các biến không tham số của dữ liệu thu được

có thể được hiệu chỉnh

Trang 11

xi

Type I error

(False positive)

Sai lầm loại I Phủ định một giả thiết không trong khi giả thiết

này lại đúng, xác suất dựa vào độ tin cậy của kiểm định kết luận

Phương sai Mức độ biến thiên trong dữ liệu thực nghiệm thu

được về cách chúng tập trung xung quanh giá trị

‘trung tâm’

Weights Trọng số Phép đo tương quan giữa các biến kết quả và các

cấu tử chính trong phép phân tích cấu tử chính về mặt các biến đóng góp như thế nào đến cấu trúc giải thích bởi cấu tử chính kết hợp

Trang 12

6.1 Kiểm định giả thiết cho giá trị trung bình 42

7.1 Kiểm định giả thiết cho giá trị trung bình 53

8.1 Kiểm định giả thiết cho giá trị trung bình 63

9 Ước lượng kích thước mẫu trong thiết kế thực nghiệm 73 9.1 Ước lượng kích thước mẫu cho thí nghiệm hai mẫu 73 9.2 Ước lượng kích thước mẫu cho thí nghiệm cặp mẫu 76

Trang 13

xiii

10 Kiểm định chất lượng và điều khiển chất lượng 78

Chương 3 Kế hoạch hóa thực nghiệm một nhân tố cho thực nghiệm hóa học

3 Các trình tự tiến hành cho kế hoạch hóa một nhân tố 93

6.4 Nguyên lý ANOVA, kiểm định thống kê và phân tích bám sát 112

7 Những khía cạnh khác của thiết kế một nhân tố 121

8 Phân tích power trong kế hoạch hóa thực nghiệm 122

3.2 Tương tác không quan trọng nhưng yếu tố hiệu quả quan trọng 149

Trang 14

xiv

3.4 Tổng quan về thiết kế thực nghiệm hai nhân tố 152

4 Phân tích Power trọng thiết kế thực nghiệm hai nhân tố 152

5 Những yếu tố khác liên quan đến thiết kế thực nghiệm hai nhân tố 155

6 Phương pháp kiểm định thực nghiệm hai nhân tố 156

7 Thiết kế thực nghiệm ba nhân tố với n lần lặp mỗi ô 156

7.3 Tổng quan về thiết kế thực nghiệm ba nhân tố 159

8 Những yếu tố khác liên quan đến thiết kế thực nghiệm hai nhân tố

3 Đanh giá hiệu lực của mô hình tuyến tính khớp 178 3.1 Hiệu lực thống kê của phương trình hồi quy 179

4 Những khía cạnh khác của phân tích hồi quy đa biến 186 4.1 Phép thử riêng biệt về độ dốc tương phản so với mục tiêu 186

Trang 15

xv

Chương 6 Phân tích dữ liệu suy luận phi tham số

3 Các phượng pháp kết luận cho thí nghiệm hai mẫu 229 3.1 Kiểm tra giả thiết cho sự khác nhau của trung vị 230 3.2 Khoảng tin cậy cho sự khác nhau của trung vị 234

4 Các phương pháp kết luận cho thí nghiệm từng đôi một 235 4.1 Kiểm tra giả thiết cho sự khác nhau của trung vị 234 4.2 Khoảng tin cậy cho sự khác nhau của trung vị 240

5.2 So sánh kép liên hệ với kiểm định Kruskal Wallis 245

6.2 So sánh kép liên hệ với kiểm định Friedman 254

9 Kiểm tra tính chuẩn hóa của dữ liệu thực nghiệm hóa học 258

9.2 Kiểm định thống kê cho đánh giá tính chuẩn 261

Chương 7 Thiết kế hai nhân tố trong thực nghiệm hóa học

Trang 17

CHƯƠNG 1

GIỚI THIỆU CHUNG

1 GIỚI THIỆU CHUNG

Hầu hết các thực nghiệm phân tích mang lại số liệu đo đạc cần được biểu thị, được phân tích và được làm sáng tỏ trong mối quan hệ của các hiện tượng hóa học đang được nghiên cứu Cho nên các dữ liệu và phép phân tích liên quan dùng để làm bằng chứng phong phú, có thể mang lại sự diễn đạt thông tin cần thiết để sử dụng Khoa học thống kê cung cấp nhiều phương thức thông qua cách biểu diễn đa dạng, phương thức đơn giản, phổ biến để giúp các nhà khoa học trong việc sưu tầm và phân tích dữ liệu của họ để thông tin trong dữ liệu có thể trở thành thông tin khoa học hữu ích và có

ý nghĩa hơn

Mở đường cho nguyên lý, quan niệm khoa học thống kê bắt đầu vào thế kỷ XVIII từ Bayes, Gauss, Laplace Những cá nhân như Francis Galton, Karl Pearson, Ronald Fisher, Egon Pearson và Jerzy Neyman đã tiếp tục phát triển nó vào nửa đầu thế kỷ

XX Sự phát triển của những khám phá cơ bản và những công nghệ phân tích dữ liệu kiểu suy đoán đã phát sinh từ vấn đề thực tiễn như: thuyết tiến hóa của Dacuyn, thuyết

về di truyền học của Mendel, và công việc của Fisher trong các thí nghiệm về nông nghiệp Trong những vấn đề đó, sự hiểu biết và khả năng của những ảnh hưởng sinh học trong sự thay đổi của loài, giống là vấn đề cần thiết phải diễn giải về các nghiên cứu Công nghệ thống kê vẫn đang được phát triển hầu hết trong mối liên hệ giữa những cần thiết trong thực tế với mạng lưới trung gian nhân tạo (ANN), phương thức

ảo, và sự tìm thấy mối liên hệ giữa hoạt tính – cấu trúc (SAR) hỗ trợ nhiều trong ngành khoa học hóa học

Những số liệu thống kê có thể được cung cấp trong phạm vi rộng các môn học để hỗ trợ việc sưu tầm và diễn giải các số liệu Hai trích dẫn gần đây nhất tóm tắt vai trò của những thông số thống kê có thể coi là phần không thể thiếu trong thực nghiệm hóa học, đặc biệt là:

“Khoa học thống kê có thể được hiểu như nghiên cứu sự biến đổi có thể xảy ra và những phương pháp thống kê có thể cung cấp bất kể khi nào, tất cả những cái mà sự thay đổi ảnh hưởng đến hiện tượng hóa học đó đang được nghiên cứu”

“Những số liệu thống kê đó là một khoa học đề cập đến sự tổng hợp, sự phân loại, sự diễn giải những dữ liệu phân tích, việc ứng dụng của lý thuyết xác suất tới phép phân tích và sự ước lượng các tham số”

Kết hợp những trích dẫn nêu bật rằng những số liệu thống kê là một công cụ khoa học dành riêng cho tất cả các khía cạnh của thực nghiệm, từ việc phân tích dữ liệu nhằm đơn giản dữ liệu để cung cấp cách biểu đạt khi phân tích nhằm mục đích thí nghiệm

Từ khi những đo đạc của hóa học là chủ đề thay đổi cái cố hữu, những phương pháp

Trang 18

thống kê cung cấp công cụ ý nghĩa để giải thích nét đặc trưng trong việc tính toán cho

sự biến đổi vốn có đó Vốn kiến thức về nguyên lý và phương pháp thống kê (điểm mạnh cũng như điểm yếu) là một phần của sự tinh xảo, kĩ năng của các nhà khoa học được xét trong sự sưu tầm, diễn giải số liệu cũng như toàn phần mô tả bản thảo Những số liệu thống kê cũng không được xem như một cách giải thích mà chỉ ra để biểu diễn sau khi dữ liệu được sưu tập Cái chốt có trong phần hổng của vấn đề Việc ứng dụng phương pháp thống kê thường được trình bày trong ngành khoa học

Thí nghiệm hóa học ứng dụng nói chung nằm ở một trong ba trường hợp sau: sự định phân(kiểm tra định lượng), sự tối ưu hóa, mô hình hóa Sự định phân có liên quan chủ yếu tới quá trình kiểm tra ví dụ: mức độ phổ biến, việc khảo sát dữ liệu được kết cấu như thế nào?, sự đảm bảo chất lượng của các phòng thí nghiệm phân tích và việc kiểm soát chất lượng của mẫu thí nghiệm như là những vật chất mấu chốt của ngôi nhà và chất điểm được xác nhận Sự tối ưu hóa thường thống nhất trong việc tìm kiếm hoặc điều tra nghiên cứu, tiến hành khi muốn đưa đến sự tối ưu cho một quá trình hóa học,

có thể được ảnh hưởng bởi một con số trong những chỉ số có liên quan Trường hợp những thí nghiệm có thể xuất hiện cả sự tối ưu hóa của quá trình phân tích, sự tối ưu hóa của quá trình hóa học mới, sự ước lượng những nhân tố hóa học khác dẫn đến sự thay đổi cho sản phẩm Thông thường kiểu thí nghiệm là căn cứ cho sự thăm dó “một chỉ số ở một thời gian nào đó tương ứng”, gần như việc đó không hiệu quả và cung cấp chỉ một phần thông tin Thông qua sự sửa đổi đơn giản hóa và hợp logic của việc kết hợp “một chỉ số ở một thời gian”để đảm bảo tất cả việc kết hợp chỉ số, nhân tố một cách hợp lý là có thể Thực nghiệm có thể tạo ra hiệu quả hơn và cung cấp càng nhiều thông tin thích hợp, hữu ích trong những ảnh hưởng của các nhân tố như là những thông tin thích hợp Nghệ thuật mô hình hóa, trong khía cạnh khác, cố gắng xây dựng mô hình của qui trình hóa học được cho là một sự tiên đoán có mục đích Nó cũng thường xuyên dựa trên kết quả thu được từ sự tối ưu hóa trong thực nghiệm nơi

mà tầm quan trọng của hệ số được xem xét và quan trọng nhất của thừa số nhằm cho việc xây dựng mẫu điển hình

Tôi sẽ cho rằng tất cả ứng dụng hóa học thực nghiệm của mẫu này trong mối quan hệ nhằm giải thích bằng phương pháp thống kê có thể cung cấp thêm sự hiểu biết và giải thích các dữ liệu thu thập được trong mối quan hệ với mục tiêu thí nghiệm Chương 2 cung cấp khái quát tham dò về phân tích dữ liệu (đồ thị và bảng tóm tắt) và kết luận từ phân tích dữ liệu (kiểm tra giả thiết và dự đoán) cho 1 và 2 ví dụ thực nghiệm Chương 3-4 mở rộng đưa thêm vào cấu trúc mô hình chính thức hơn cho 1, 2, 3 thừa

số thực nghiệm với chương 4 gộp lại trên mô hình thừa số, dễ dàng hơn thiết lập thay thế gần hơn OFAT cổ điển Một giới thiệu quan trọng về mẫu được cung cấp trong chương 5 thông qua phương pháp hồi quy phù hợp cho mối tương quan phù hợp(tuyến tính, tổ hợp) cho dữ liệu hóa học Phân tích ứng dụng của phương pháp kĩ thuật trên mẫu của sự điều chỉnh và so sánh 2 đại lượng tuyến tính sẽ được phân tích Chương 6

Trang 19

giới thiệu phương pháp phi tham số thay thế cho tham số thủ tục đề cập trước đó Dựa trên phương pháp thực nghiệm liên quan đến sự tối ưu hóa được đề cập thêm trong chương 7 thông qua 2 cấp thừa số mẫu cho nhiều thừa số thực nghiệm Chương cuối, chương 8, giới thiệu về phương pháp đa biến phù hợp để xử lý tập hợp các dữ liệu phản hồi nhiều kĩ thuật và nguyên lý sẽ được tìm hiểu thường xuyên là đánh dấu cho các cuộc thảo luận của Hóa Đạc, nhân vật đã đưa ra đánh dấu phương pháp kỉ luật sử dụng trong toán học và phương pháp thống kê giúp cho thu được thông tin thích hợp

từ các dữ liệu hóa chất

Nguồn năng lượng tăng mạnh, các phần mềm và máy tính sẵn có đã cho phép những phương pháp thống kê phát triển phổ biến, sẵn có và đơn giản hơn cho cách giải quyết những dữ liệu hóa học Trên cơ sở này thì tất cả các khái niệm phân tích sẽ được điều chình khi sử dụng phần mềm (Excel và Minitab) để cung cấp cách biểu diễn số liệu trên đó phép phân tích có thể được làm cơ sở Khi đó thì vấn đề toán học chính xác dữ liệu thống kê sẽ được lờ đi, thậm chí là cố ý lờ đi Để có thể xây dựng được bức tranh về những dữ liệu thống kê có thể dự kiến phép đo qua thông tin về chất từ phần mềm đưa ra Hầu hết các phương pháp được bàn luận tới thuộc loại cổ điển tuy vậy những phương pháp ứng dụng này vẫn còn đang phát triển

2 TẠI SAO SỬ DỤNG THỐNG KÊ?

Một câu hỏi thường xuyên được đưa ra bởi các nhà hóa học đó là “Những dữ liệu thống kê có giá trị và liên quan gì tới hóa học” Các dữ liệu thống kê được mô tả như một tập hợp of techniques which cover the design of experiments, the collection of experimental data, the modes of presentation of data, and the ways in which data can

be analysed for the information they contain Statistical concepts, therefore, are relevant to all aspects of experimen- tation ranging from planning to interpretation The latter can be subjective (exploratory data analysis, EDA) as well as objective (infer- ential data analysis, estimation) but the basic rule must be to under- stand the data as fully as possible by presenting and analysing them in a form whereby the information sought can be readily found Examples where statistical methods could be useful include:

• Assessing whether analytical procedures and/or laboratories differ in accuracy (systematic error) and precision (random error) of reported measurements,

• Assessing how changing experimental conditions affect a particular chemical outcome,

• Assessing the effect of many factors on the fluorescence of a chemical complex

Such experimentation would produce numerical data which would require to be presented and analysed in order to extract the information they provide in respect of the experimental objective Statistics, through its presentational and interpretational

Trang 20

procedures, can provide such means of turning data into useful chemical information which explain the phenomena investigated Statistics can also provide tools for designing experiments ranging from simple laboratory experiments to complex experiments for analy- tical procedures As assessment of chemical data is becoming more technical and demanding, this, in turn, is requiring chemists to consider more actively design structures that are efficient and to put greater emphasis on how they present and analyse their data using statistical methods Such pressure encourages a greater awareness of the role of statistics in scientific experimentation3 together with a greater level of usage Use of statistical techniques are advocated by professional bodies such as The Royal Society of Chemistry (RSC) and the Association of Official Analytical Chemists (AOAC) for the handling and assessment of analytical data to ensure their quality and reliability Statistical procedures appropriate to this type of approach form the basis of the Valid Analytical Measurement (VAM) scheme produced by the La- boratory of the Government Chemist (LGC)? the National Measure ment and Accreditation Service (NAMAS) of the United Kingdom Accreditation Service (UKAS), and other schemes including IS09000, BS5750, and GLP for the reporting of analytical measurements These support initiatives and accreditation schemes highlight the importance placed on using statistical methods as integral to chemical data hand- ling

3 PLANNING AND DESIGN OF EXPERIMENTS

In designing an experiment, we need to have a clear understanding of the purpose of the experiment (objective), how and what response data are to be collected (measurements to be made), and how these are to be displayed and analysed (statistical analysis methods) Design and statistical analysis must be considered as one entity and not separate parts to be put together as necessary A well planned experiment will produce useful chemical data which will be easy to analyse by the statistical methods chosen A badly designed and planned experiment will not be easy

to analyse even if statistical methods are applied Why is design so important? Inadequate designs provide inadequate data, so if we wish to assess experimental objectives properly, we need to design the experiment so that appropriate information for assessing the experimental objective is forthcoming In addition to the statistical considerations of design structure, we also need to ensure that instru- ments are properly calibrated, experimental material is uncontaminated, the experiment is performed properly, and the data being recorded are suitable for their intended purpose We must also ensure that there are no trends in the data through, for example, technicians operating instruments differently and batches of material being non-uniform, and that the influence of unrecognised causal factors is minimised In comparing the measurement of two analytical procedures, for instance, it would be advisable to use comparable samples of known chemical content or else it may be impossible to know whether the procedures are efficient in their recording of the

Trang 21

chemical response In the chemical sciences, reduction in response variability (improved precision) by appropriate choice of factor levels may also be an important considera- tion Cost, problem knowledge, and ease of experimentation also come into play when designing a chemical experiment It is therefore important that an experiment be carefully planned before implementation and data collection If necessary, advice on structure and analysis should be sought in order to ensure that choice of, for example, number of samples to be tested, amount of replication to carry out, statistical analysis routine, and software are most appro- priate for the experimentation planned With such advice, experimenta- tion, data collection, and data analysis can readily take place with the experimenter knowing how each part comes together to address the experimental objectives Planning of experiments is not

an easy process but by producing an experimental plan, or protocol as it is referred to

in clinical trials, we can develop a useful step-by-step guide to the experimentation and subsequent data analysis The four aspects associ- ated with the specification of an experimental plan are as follows:

1 Statement of the objectives of the investigation

This refers to a clear statement of the aims and objectives of the proposed experiment Specification of the experimental objective(s) is the most important and fundamental aspect of scientific experi- mentation as it lays down the question(s) the experiment is going to try to answer This, in turn, helps focus the subsequent planning, data collection, and data analysis towards the goal(s) of the experiment

2 Planning of the experiment

Planning entails considering how best to implement the experiment to generate relevant chemical responses It encompasses choice of factors and ranges for experimentation, how such are to be controlled, how the experimental material is to be prepared, choice of most appropriate chemical outcome best reflective of the objective(s), the decision on how many measurements to collect, and how best to display and analyse the outcome measured (the statistical data analysis) These decisions are largely within the control of the experimenter through their knowledge

of the subject area and any constraints affecting experimentation such as instru- ment usage and preparation of experimental material The statis- tical data analysis components chosen may also influence these aspects of experimental planning

3 Data collection

This refers to the physical implementation aspect of the experiment which will produce the chemical response data Consideration must be given to whether instrument calibration is necessary, how experi- mental material is to be prepared and stored, how the experiment itself is to be conducted, and how the chosen chemical response is to be recorded through either measurement or observation

Trang 22

4 Data analysis

Statistical methods, incorporating exploratory and inferential data analysis, should be employed in the analysis of the experimental data though choice of which technique(s) depends on the experi-mental objective(s), the design structure, and the type of chemical response to be measured Inferential data analysis (significance bài kiểm tra

và khoảng tin cậy) cho phép kết luận được khách quan hơn là chủ quan, cung cấp một

cơ sở khách quan cho các quyết định về những tác động hóa học của những phát hiện

Sự liên quan và hiệu lực hóa học của các kết luận xoay quanh khả năng của người thí nghiệm để dịch các kết quả thống kê vào hóa thông tin hữu ích và có ý nghĩa Lựa chọn cấu trúc thiết kế thử nghiệm là quan trọng đối với việc tiến hành một thử nghiệm tốt Tại sao lựa chọn thiết kế là rất quan trọng trong thí nghiệm hóa học có thể chỉ đơn giản là tóm tắt thông qua các điểm sau đây:

• Các thử nghiệm nên đã xác định mục tiêu (s) để đánh giá đối với các hiện tượng hoá học liên kết với nó

• The thiết kế nên được hiệu quả bằng cách tối đa hoá thông tin thiết kế được sử dụng tối thiểu của nỗ lực thử nghiệm (nhỏ và hiệu quả)

• Các thiết kế nên được thực hiện (dễ thực hiện và phân tích) và, nơi tốt, thực hiện theo một cấu trúc thiết kế các tài liệu (thường được sử dụng thiết kế, được biết cấu trúc để phân tích dữ liệu)

củng cố các điểm này cần phải xem xét một thử nghiệm quy hoạch cẩn thận và cố gắng sử dụng một cấu trúc thiết kế mà sẽ cung cấp dữ liệu cần thiết như là cách hiệu quả nhất có thể Ngoài ra, họ cho thấy cấu trúc nên cũng được như vậy rằng các dữ liệu thu thập được có thể được phân tích bằng cách sử dụng đơn giản và dễ hiểu phương pháp thống kê kế hiệu quả Có thể được đo bằng các lỗi thử nghiệm mà phát sinh từ các biến thể giữa các đơn vị thực nghiệm và các biến thể từ việc thiếu tính thống nhất trong việc thi hành thử nghiệm Các lỗi nhỏ thử nghiệm các thiết kế hiệu quả hơn Bởi giới thiệu các loại điều khiển như tăng số lượng các đơn vị thực nghiệm

và số yếu tố trong thử nghiệm, các tác động của biến thể này không kiểm soát được (tiếng ồn) có thể được giảm bớt và thiết kế được thực hiện hiệu quả hơn Phương pháp thống kê cơ bản cố gắng để tách tín hiệu (các phản ứng) từ tiếng ồn (lỗi) để cấp tín hiệu tương đối với tiếng ồn có thể được đo, các giá trị lớn đang được chỉ có hiệu lực giải thích ý nghĩa của các giá trị nhỏ và cung cấp bằng chứng về cơ hội, và không giải thích, có hiệu lực

4 PHÂN TÍCH DỮ LIỆU

Dữ liệu từ các thí nghiệm hóa học có thể mất nhiều hình thức, nhưng nguyên tắc cơ bản là họ yêu cầu để được giải thích theo

Trang 23

các thử nghiệm các mục tiêu Cả hai yếu tố chủ quan và khách quan phân tích cần được xem xét, các cựu tương ứng với phân tích dữ liệu thăm dò (thiết kế vi mạch) và các nguyên tắc sau để suy luận nguyên tắc phân tích dữ liệu Thiết kế vi mạch được dựa trên bằng cách sử dụng các đồ thị và biểu đồ để trình bày các dữ liệu trực quan để giải thích Đồ họa phương thức trình bày khác nhau nhưng điểm quan trọng là sử dụng một trong những điều này giúp trình bày các dữ liệu trong một hình thức liên quan đến việc đánh giá các dữ liệu Kết hợp với lô dữ liệu, nó cũng hữu ích để tóm lược hiện nay số đó cung cấp cho các mô tả gọn gàng về tính chất của dữ liệu thu thập được Nói chung, chúng tôi sử dụng một bản tóm tắt về vị trí (có nghĩa) và tóm tắt một của biến thiên (độ lệch chuẩn, RSD), tính chính xác đo và độ chính xác của cựu thứ hai Đối với độ chính xác, các giá trị thấp biểu chặt chẽ nhóm dữ liệu chỉ chính xác tốt (thấp biến, cao nhất quán) Sử dụng các biện pháp đó gọn gàng tóm tắt hai tính năng quan trọng của hầu hết các loại dữ liệu hóa học, chính xác và độ chính xác phân tích

dữ liệu suy luận bao gồm những thủ tục thống kê chính thức (t xét nghiệm, F kiểm tra, khoảng tin cậy) được sử dụng để rút ra kết luận khách quan từ các dữ liệu thực nghiệm Họ cung cấp các phương tiện đánh giá chứng cứ trong các dữ liệu trong ân hoặc chống lại các mục tiêu thử nghiệm được chỉ định, tức là ý nghĩa của các kết quả

có khả năng Nhiều tồn tại thủ tục suy luận với những người thích hợp nhất phụ thuộc vào các mục tiêu của thử nghiệm, cấu trúc thử nghiệm, và tính chất của dữ liệu thu thập được Khi thử nghiệm được hoàn thành và phân tích thống kê đã có, một báo cáo

có thể được viết nêu bật những kết luận đạt và khuyến nghị thực hiện Khi thử nghiệm thường là một quá trình liên tục, với một thử nghiệm trả lời một số câu hỏi và đồng thời đặt ra những người khác, các kết luận đạt có thể đề nghị thêm một vòng các thí nghiệm Nó phải luôn luôn được ghi nhớ rằng các kết luận đạt được chỉ hợp lệ cho tập các điều kiện được sử dụng trong thử nghiệm với một sự lựa chọn rộng các điều kiện thực nghiệm do đó có khả năng để thực hiện các kết luận thêm áp dụng

5 TƯ VẤN HỖ TRỢ CHO THỐNG KÊ

Nhiều người tin rằng vai trò của một viên thống kê chỉ giúp với các phân tích dữ liệu một khi một thử nghiệm đã được tiến hành và thu thập dữ liệu Điều này về cơ bản là sai Một thống kê có thể cung cấp sự trợ giúp với tất cả các khía cạnh của thử nghiệm

từ lập kế hoạch thông qua để phân tích dữ liệu để hoàn tất quá trình thử nghiệm có thể được xây dựng tuần tự và không phải là một chuỗi các rào cản phải vượt qua khi đạt đến không có khả năng tưởng vào một khía cạnh trước

Thông qua hợp tác này hoạt động, tư vấn về cấu trúc thiết kế và phân tích dữ liệu theo sau có thể được phát triển ở giai đoạn lập kế hoạch, gắn với các mục tiêu thực nghiệm cho phép thử nghiệm và phân tích dữ liệu được phối hợp tốt hơn Khi tư vấn một thống kê để được tư vấn thông tin nền, ngày đề xuất các thử nghiệm cần được cung cấp để giúp họ xác định, với experimenter, cách tốt nhất để phù hợp với mục tiêu thử

Trang 24

2 Ưu tiên công việc

Làm thế nào đã làm các nghiên cứu thu thập thông tin của họ? Là bất kỳ thủ tục của

họ phù hợp với kế hoạch thử nghiệm? Làm thế nào để các nghiên cứu khác liên quan đến các kế hoạch thử nghiệm? Loại phản ứng dữ liệu sẽ được thu thập?

3 Trả lời câu hỏi về dữ liệu

Làm thế nào để các dữ liệu đó liên quan đến các mục tiêu thí nghiệm? Có kích thước của mẫu đã được quyết định được? Làm thế nào có nhiều thí nghiệm được lên kế hoạch và được nhân rộng cần thiết như thế nào là những dữ liệu được trình bày và phân tích thống kê? Tại sao sử dụng các phương pháp và những người khác không?

4 Phân tích dữ liệu

Những gì họ có thể hiển thị đối với các mục tiêu thử nghiệm phần mềm thống kê có thể được sử dụng để sản xuất trình bày dữ liệu và kết quả suy luận thống kê (dễ dàng kiểm tra? Sử dụng một dữ liệu giả thiết)?

5 Sử dụng các phần mềm thống kê

Có thể được sử dụng phần mềm này được gắn với các cơ sở xử lý văn bản để đơn giản hóa các văn bản báo cáo và các yếu tố trình bày việc xem xét phải được cho là rất nhiều khía cạnh của thử nghiệm bố quy hoạch trước khi tư vấn có thể có một thống kê

để được hỗ trợ Lý tưởng nhất, vai trò của một thống kê phải được thử để hướng dẫn các cua người thí nghiệm thông qua những khía cạnh liên quan đến dữ liệu thu thập, hiển thị, và phân tích được một người thí nghiệm là không rõ, với sự thỏa hiệp giữa những gì là lý tưởng và những gì được thực hiện thường xuyên cần thiết Thích hợp giải thích các kết quả đối với các mục tiêu thử nghiệm là trách nhiệm của những người thí nghiệm, lấy tính toán của những mục tiêu, những phương pháp thống kê được sử dụng và các tác động hóa học đến các kết quả

6 GIỚI THIỆU VỀ PHẦN MỀM

Bảng tính, như Excel5, và phần mềm thống kê, như Minitab6, là các công cụ quan trọng trong xử lý dữ liệu Chúng cung cấp quyền truy cập vào điều khoản lớn mà thường được sử dụng rộng rãi trong đồ họa và thói quen phân tích thống kê mà đã trở thành xương sống của việc phân tích thống kê dữ liệu Chúng đơn giản để sử dụng, và với phạm vi về chức năng, cho phép nhiều hình thức trình bày dữ liệu có sẵn cho các

Trang 25

thí nghiệm viên Như vậy, phần mềm có thể có sẵn trên nhiều phương tiện, kể cả được

sử dụng trong môi trường máy tính cá nhân trên Windows

Tôi đã chọn cơ sở sử dụng phần mềm trên bảng tính Excel và các phần mềm Minitab thống kê Điều thứ hai là Excel vẫn chưa phát triển đầy đủ vào mảng dành riêng cho các cách thống kê phần mềm, và theo mặc định, nhiều phương tiện phân tích thống kê

có liên quan trong các thử nghiệm hóa học Các thủ tục bị bỏ quên bao gồm việc kiểm tra các chương trình ANOVA, các kế hoạch nhân tố 2 mức, thủ tục hồi quy tốt nhất cho hồi quy nhiều mô hình và các phương pháp nhiều chiều khác Phần mềm khác, như là SAS7, S – plus8 và GLIM9 đều có thể được sử dụng, nhưng tôi tin rằng Minitab

là tốt nhất bởi nó đơn giản, dễ sử dụng và tương thích làm việc với hầu hết các tính năng của Excel Việc trình chiếu các dữ liệu có thể được chuyển một cách dễ dàng sang các gói phần mềm khác

Trong việc minh họa các dữ liệu phân tích thống kê, tôi sẽ trình bày và giải thích ngắn gọn các cửa sổ hộp thoại liên kết với các cách phân tích để phần mềm được sử dụng nhằm tạo ra các sản phẩm đã phân tích Ngoài ra, trong hầu hết các phần mềm trình bày kết quả đầu ra, tôi sẽ cung cấp thông tin về cách lấy kết quả đã thu được trong phần mềm khi sử dụng các mệnh lệnh Việc chọn lọc đầu ra cũng xảy ra nhằm cho phép các kết quả đầu ra được trình bày tốt hơn so với ban đầu trong các trường hợp 5

Microsoft Excel là một nhãn hiệu đã đăng ký của Tập đoàn Microsoft, One Microsoft Way, Redmond, WA 98052-6399, USA

Trang 26

Hình 1.1 Màn hình Excel đầy đủ

6.1 Excel

Các thông tin được trình bày trong văn bản này đề cập đến Excel phiên bản 5.0, nơi

mà các mục để nhập là màn hình VDU tương tự như hình 1.1, dựa trên một bảng tính mới Thanh menu ở trên cùng của màn hiển thị thể hiện các thủ tục chính có sẵn trong Excel Các thanh công cụ ở phía dưới bao gồm hầu hết các chương trình, dựa vào con trỏ chuột trên một nút (không có bấm), một mô tả ngắn về chương trình là được hiển thị với thanh trạng thái ở phía dưới màn hình hiển thị một cách đầy đủ hơn Mô tả sự hoạt động của Excel trong văn bản này sẽ được dựa trên cách sử dụng thanh menu

Thanh Menu File có quyền truy cập vào bảng tính các trạng thái mở, lưu file hay in ấn trong khi menu Edit cung cấp quyền truy cập sao chép và dán file một cách dễ dàng

để di chuyển các dữ liệu View cung cấp cách tiếp cận với các cách nhằm xem sự khác nhau giữa các trang bảng tính Với Insert, cho phép chèn hàng, cột, biểu đồ hoặc các

hàng trống để chèn vào bảng tính Định dạng của các tế bào của bảng tính có thể

thông qua menu Format Menu Data có thể được truy cập để phân loại và xếp thành bảng các dữ liệu Menu Window cho phép sự thay đổi giữa các bảng tính trên diện

rộng của đường dây giúp đỡ và hướng dẫn hỗ trợ có thể được truy cập qua menu

Help

Đầu ra của các đồ thị được tạo ra bởi việc kích nút Chartwizard, định vị ngay lập tức ở dưới “t” trong hình 1.1, nút trông như một biểu đồ tần xuất với sự chuyển dịch nhanh chóng ở trên cùng Nhiều cách trình bày đồ họa, như được mô tả trong hình 1.2, có thể

cố định từ đơn giản như đồ án X-Y (tỏa ra XY) đến thống kê mẫu (Dòng) Hình 1.2

Trang 27

tương ứng với sự lựa chọn có sẵn trong bước 2 của ChartWizard, nơi mà bước 1 được

sử dụng để chỉ ra các dữ liệu dược dùng Đồ thị phải được chọn bằng cách đánh dấu vào ô thích hợp, kiểm tra hộp đề cập đến hình thức của đồ thị theo các lựa chọn cần thiết, và theo các bước hướng dẫn của nhà cung cấp

Hình 1.2 Các kiểu biểu đồ mẫu trong Excel qua bảng ChartWizard

Hình 1.3 Bảng phân tích dữ liệu trong Excel

Mặc định tính năng phân tích dữ liệu thống kê của Excel có chứa các lệnh phân tích

dữ liệu trong menu Tools như hình 1.3 Các công cụ có sẵn trong khoảng từ sự mô tả

các số liệu thống kê đơn giản (Descriptive Statistics) thông qua chương trình ANOVA (Anova: Sao chép 2 nhân tố) để hồi quy mô hình phương pháp (Regression) Nếu

phân tích dữ liệu không có sẵn khi menu Tools được chọn, nó có thể được thêm vào

bằng cách chọn Tools ðAdd-ins và tải ở Analysis ToolPak Nếu ToolPak này không

Trang 28

Bảng tính tạo ra trong Excel có thể chứa dữ liệu hoặc dữ liệu thống kê phan tích các yếu tố (đồ họa, thuyết trình, tóm lược)

Bảng 1.1 Cách sử dụng Excel

Mục Hướng dẫn

Lệnh trình đơn Menu được chọn được chỉ rõ với chữ cái đầu tiên viết hoa Tools cho

phép truy nhập tới công cụ Data Analysis trong Excel

In đậm văn bản Bôi đen những đoạn văn bản tương ứng đã được gõ vào, ví dụ Total

Nitrogen, chọn menu option hoặc ấn vào nút trong option đó

Các lệnh menu Sử dụng con trỏ để bôi đen các lệnh menu riêng biệt Ví dụ chọn Tool

> Data analysis > Descriptive Statistics > chọn Ok giống như chọn

Tool menu option, mở menu phụ Data Analysis bởi cách kích vào tiêu

đề Data Analysis, chọn Descriptive Statistics bằng cách kích vào Descriptive Statistics heading, sau đó kích vào Ok để kích hoạt nó Kết quả sẽ xuất hiện trên cửa sổ thoại của công cụ phân tích Descriptive Statistics

Khi xuất hiện dòng chữ “for Input range, click and drag across cells

A1:A14”,thì phải kích chuột vào ô A1, giữ chuột và kéo xuống ô A14 Những dữ liệu trong các ô từ A1 đến A14 đã được kích hoạt

Khi xuất hiện dòng chữ “select the Chart Title box and enter Plot of

Total Nitrogen Measurements” thì phải kích chuột vào hộp hiện rõ

Chart Title và gõ những thông tin vào hộp thoại Việc làm này giúp cho Excel thực hiện những yêu cầu đã được đánh dấu

Khi dòng chữ “select Output Range, click the empty box, and enter

C1” xuất hiện thì dừng Output Range, kích hoạt hộp thoại liên kết, và nhập thông tin vào Việc làm này giúp chỉ ra vị trí số liệu đầu ra được tạo nên trong bảng tính Excel

Trang 29

Các yếu tố phân tích có thể được đặt vào trong cùng bảng tính (giản đồ 1) của cùng sổ làm việc hoặc trong từng bảng tính riêng biệt (giản đồ 1, 2…) Có thể truy nhập vào từng bảng tính riêng biệt bằng cách chọn vào thanh Sheet ở trên cùng của màn hình Excel (hình 1.1) Các biểu đồ tạo thành xuất hiện trong cùng bảng tính nếu gọi ra kí

tự embedded charts

Dữ liệu nhập vào Excel phải được nhập vào dưới dạng cột, hoặc hàng của bảng tính Nếu phù hợp, một kí hiệu bất kì có thể được nhập vào đầu mỗi cột (hoặc dòng) Các thông tin khác liên quan tới dữ liệu cũng có thể được nhập vào nếu cần Sau một lần nhập dữ liệu thì ta có thể kiểm tra độ tin cậy của chúng và sau đó lưu chúng trong một

sổ làm việc (đuôi xls) Sau lần đầu tiên lưu dữ liệu, ta có thể chọn lệnh trình đơn bằng cách: File -> Save As và điền vào cửa sổ thoại cho phù hợp Các dãy con lưu trữ sau khi dữ liệu được cập nhật hoặc phân tích, có thể phụ thuộc vào lệnh trình đơn File -> Save Các file như vậy có thể dễ dàng nhập vào nhiều hệ thống phần mềm window cơ bản như Word và Minitab (chỉ dữ liệu) Việc mở những sổ làm việc đã lưu trước đây

dễ dàng thực hiện qua lệnh trình đơn File -> Open Công cụ Edit -> Copy và Edit -> Paste cho phép nhập dữ liệu từ Excel tới hệ thống phần mềm window cơ bản bằng bộ nhớ tạm thời khi thực hiện một cách đồng thời các chương trình phần mềm

6.2 Minitab

Các thông tin được trình bày trong phần này đề cập đến phiên bản Minitab 10.5 Xtra (hình 1.4 là màn hình giao diện của phần mềm này) Minitab được vận hành bằng cách sử dụng một dãy các cửa sổ để lưu giữ các dữ liệu và in ấn các dữ liệu đã phân tích Cửa sổ dữ liệu (Data window) là cửa sổ cho phép nhập dữ liệu vào dưới dạng excel Cửa sổ thao tác (Session window) cho phép nhập các câu lệnh điều khiển và hiển thị kết quả bằng số Biểu tượng Info cho phép truy cập đến các cửa sổ Info chứa

dữ liệu và số lượng các theo dõi trong các bảng hiển thị trên Data window Biểu tượng History cho phép truy cập vào cửa sổ History, tại đó hiển thị tất cả các câu lệnh đã được thực hiện trong Minitab session Cửa sổ đồ thị (Graph window) chỉ được kích hoạt khi có yêu cầu vẽ đồ thị và tại đó sẽ hiển thị các đồ thị kết quả được tính toán bởi Minitab Khi sử dụng Minitab, các cửa sổ Data, Session và Graph là quan trọng nhất

Trang 30

Thanh menu ở trên cùng của màn hình chứa các menu thực hiện được trong Minitab Menu File chứa các đường dẫn tới mục mở và lưu kết quả, lấy ra file kết quả, file in

và hiển thị kết quả Trong khi đó menu Edit chứa các chức năng như sao chép (copy), dán (paste), và di chuyển (move) trên data window Menu Maip và Calc chứa thao tác với dữ liệu và tính toán đặc biệt Những chương trình phân tích dữ liệu thống kê được truy nhập qua menu Stat và sự lựa chọn menu phụ thích hợp liên quan đến phép phân tích dữ liệu Những phương pháp có hiệu quả bao gồm phần lớn các cách phân tích dữ liệu thống kê xuất phát từ thống kê chuẩn (Basic Statistics), tất cả hợp thành thống kê

mô tả và hai phương pháp lập luận chuẩn, thông qua phương pháp ANOVA, bao gồm bài toán một nhân tố và nhiều nhân tố, cho tới phương pháp đa biến (Multivariate), ví

dụ như phân tích thành phần chính và phân tích biệt số Menu Graph cho phép truy cập tới tính năng vẽ đồ thị trong đồ thị X-Y, đồ thị hình hộp (boxplot), đồ thị điểm (Character Graphs » Dotplot), đồ thị đoạn, đồ thị chuẩn (Normal plot) Menu Editor cho phép chỉnh sửa ngôn ngữ và phông chữ của các câu lệnh Việc di chuyển giữa các cửa sổ có thể được thực hiện thông qua menu Window, trong khi đó để được trợ giúp

có thể sử dụng menu Help

Bảng 1.2 Cách sử dụng Minitab

Mục Hướng dẫn

Trang 31

Lệnh trình đơn Menu được chọn được chỉ rõ với chữ cái đầu tiên viết hoa Graph cho

phép truy cập đến công cụ vẽ đồ thị và Stat cho phép truy cập đến công

cụ phân tích thống kê

In đậm văn bản Bôi đen những đoạn văn bản tương ứng đã được gõ vào, ví dụ

Absorbance, chọn menu option hoặc ấn vào nút trong một hộp thoại

Các lệnh menu Các lệnh menu được bôi đen đen riêng biệt bằng con trỏ Ví dụ chọn

Stat > ANOVA > Balanced ANOVA, giống như chọn Stat menu , mở menu phụ ANOVA bởi cách kích vào tiêu đề ANOVA, chọn Balanced ANOVA bằng cách kích vào tiêu đề Balanced ANOVA Kết quả sẽ xuất hiện trên cửa sổ thoại Balanced ANOVA

Khi xuất hiện dòng chữ “for Classification variable, select Lab and

click Select”,thì phải kích chuột vào biểu tượng phòng thí nghiệm xuất

hiện trong hộp chứa các biến ở trên cùng góc trái của cửa sổ menu phụ

và chọn vào nút Select

Khi xuất hiện dòng chữ “select the Label 2 box and enter

Concertration” thì phải kích chuột vào hộp hiện rõ Label 2 và gõ những thông tin vào hộp thoại Việc làm này giúp cho các lệnh của Minitab được thực hiện

Khi dòng chữ “for Display, select Data ” xuất hiện thì có nghĩa là phải

kiểm tra hộp dữ liệu đã được đánh dấu để khẳng định thông tin đã được xác nhận

Minitab có thể được vận hành bằng cách sử dụng các lệnh điều khiển hoặc các lệnh trình đơn Tôi sẽ chỉ sử dụng cái thứ hai để minh họa cách sử dụng Minitab Một bản tóm tắt các cách sử dụng được chỉ ra trên bảng 1.2 Chỉ những cách này mới phù hợp với phương pháp nghiên cứu thống kê sẽ được thực hiện, mặc dù các cách sử dụng đó chỉ là một phần nhỏ trong toàn bộ khả năng điều khiển và biểu diễn của Minitab

Trong Minitab, dữ liệu nhập vào được thực hiện tốt nhất khi nhập vào dưới dạng bảng tính (được hiển thị ở cửa sổ Data) mặc dù các câu lệnh điều hành có thể được sử dụng như nhau Dữ liệu được nhập vào dưới dạng các cột của bảng tính, ví dụ C1 ứng với cột 1, C2 ứng với cột 2… (xem hình 1.4) Không giống như trong Excel, ta không thể trộn các kiểu dữ liệu trong một cột bằng cách gán một kí hiệu thay cho dữ liệu trong cột đó vì bảng tính trong minitab không phải là bảng tính thật Chỉ có 1 dạng số liệu

có thể được nhập vào cột dưới dạng kí hiệu (tối đa là 8 kí tự) đó là sử dụng ngay ô trống bên dưới tựa đề của cột

Trang 32

Khi nhập dữ liệu vào ta nên kiểm tra độ chính xác của dữ liệu và sau đó lưu dữ liệu vào đĩa trong một tệp chứa bảng làm việc (có đuôi mở rộng là mtw) Khi lần đầu tiên lưu số liệu, ta sử dụng menu lệnh: File/Save Worksheet as và điền vào hộp thoại kết quả tiếp theo Đối với các lần lưu số liệu sau, nếu số liệu được hiệu chỉnh hoặc thêm vào, ta nên sử dụng menu lệnh File/ Save Worksheet để tự động cập nhật cho tệp dữ liệu Nếu muốn phần mềm Minitab cũng có thể lưu dữ liệu ở dạng Excel (có đuôi mở rộng là xls) bằng cách thay đổi trong mục “Save File as Type” trong cửa sổ hộp thoại

“Save Worksheet As”, nhờ đó có thể trao đổi các tệp dữ liệu giữa Excel và Minitab Các lệnh Edit/Copy và Edit/Paste đưa ra các cách khác để nhập và xuất dữ liệu từ Minitab đến các phần mềm khác chạy trên Windows qua bộ nhớ tạm thời khi làm việc đồng thời với các gói phần mềm

Trang 33

sự tính toán các phép đo sự biến thiên có trong các phép đo đó

Sự thuận lợi của việc tính toán tất cả các kết quả phân tích gần đúng cung cấp cho người dùng khả năng xem xét toàn diện từ chủ quan đến khách quan trong việc làm giải thích số liệu kết quả thu được Phương pháp đồ thị cho phép dữ liệu được trình bày trực quan trong khi sử dụng các tóm tắt dạng số lại đưa ra các cách mô tả định lượng số liệu Các cách phân tích đưa ra kĩ thuật cho việc phân tích khách quan dựa trên việc sử dụng các số liệu thu được để xem xét các dữ kiện có liên quan đến đối tượng thí nghiệm Các cơ sở phân tích trên đều được dùng trong chương này và đã được thừa nhận chẳng hạn như được thừa nhận bởi phòng thí nghiệm hóa học thuộc chính phủ (LGC) dùng cho việc đánh giá độ chính xác, độ sai biệt trong các phép đo phân tích

Có nhiều phương pháp phân tích, các phương pháp này cung cấp các kĩ thuật cho việc

xử lý một số lượng lớn các tính huống thực nghiệm khác nhau Chúng được chia thành hai nhóm lớn: các phương pháp có tham số và các phương pháp không có tham

số Hai nhóm phương pháp này khác nhau ở: các giả thiết làm cơ sở cho hai phương pháp, loại số liệu phù hợp dùng trong hai phương pháp, cách thức sử dụng số liệu và khả năng kết hợp của chúng Các thí nghiệm có tham số dùng số liệu thu được (thường là các số liệu định lượng có tính liên tục) và dựa trên các giả thiết về tính chất của các số liệu kết quả đo được Ngược lại, các phương pháp không có tham số bị hạn chế bởi điều kiện của các giả thiết, bởi loại dữ liệu phù hợp sử dụng cho phương pháp

đó và bởi việc trình bày lại các số liệu thành các dãy, các nhóm số liệu Các kết quả trong phương pháp này nói chung thường có giá trị thấp hơn các kết quả tương ứng của phương pháp có tham số

Số liệu thí nghiệm tùy thuộc vào các phép đo phụ thuộc vào cách tiến hành quan sát trên các vật liệu thí nghiệm với mục đích là đánh giá số liệu thu được Các giá trị biến đổi khi đo thường được quy là biến số giá trị Trong thí nghiệm hóa học, nó có thể là

Trang 34

Ví dụ như nồng độ phân tích, pH của dung dịch đệm và các lượng chuẩn độ) Các số liệu hóa học có thể định tính, chúng tương ứng với các khoảng của số liệu định lượng được sắp xếp theo thứ tự, ví dụ như sự đổi màu của giấy quỳ hay mức độ nguy hiểm của các chất hóa học có hại

Tất cả các phương pháp phân tích được trình bày trong phần này là sử dụng các số liệu hóa học định lượng và tiếp cận từ hai góc độ: dùng các thống kê mô tả hoặc dùng các thống kê suy luận bao gồm cả đánh giá Hai thống kê này đều gồm: cách sắp xếp

số liệu, biểu diễn đồ thị (các biểu đồ số liệu đơn giản) và đánh giá các số liệu thống kê (giá trị trung bình, độ lệch chuẩn, RSD) Các thành phần này thường có vai trò quan trọng trong phân tích số liệu thực nghiệm khi phân tích và giải thích số liệu thực nghiệm Thống kê suy luận và các phép đánh giá bao gồm các phương pháp thống kê (các test t, test F, khoảng tin cậy) được dùng để giúp cho việc đưa ra các kết luận khách quan từ các số liệu thực nghiệm Chúng cho thấy tầm quan trọng của việc đánh giá đúng cách đối tượng thực nghiệm bằng cách xem xét các dữ kiện trong số liệu kết quả và dùng các dữ kiện đó để khẳng định các số liệu kết quả là chấp nhận hay bác bỏ đối với đối tượng nghiên cứu Nội dung chính của phần này sẽ giải thích việc sử dụng đồng thời các kĩ thuật phân tích để giải thích các số liệu hóa học

2 TÓM TẮT DỮ LIỆU HOÁ HỌC

Để giải thích dữ liệu thí nghiệm, tóm tắt dữ liệu là việc cần thiết đầu tiên Đó là nền tảng để nghiên cứu và giải thích hoá học Tóm tắt dữ liệu dựa trên các công cụ EDA, các phương pháp kỹ thuật như đồ hoạ và phân tích số học

2.1 Trình bày đồ hoạ

Để giải thích các dữ liệu được tập hợp từ các thí nghiệm hoá học theo dạng nguyên bản, dạng chuỗi kích thước hay một loạt các số đo là rất khó khăn Các biểu đồ dữ liệu đồ hoạ có thể miêu tả một cách đơn giản và tóm tắt ngắn gọn dữ liệu nhưng vẫn đầy đủ và rõ nghĩa Vì vậy, bằng cách sử dụng đồ hoạ để thuyết trình các kết quả thí nghiệm được liên kết với nhau một cách rõ ràng Công dụng của đồ hoạ để đánh giá

dữ liệu đã được mọi người ủng hộ trong nhiều năm Thực tế, trong những năm1850, Florence Nightingale tin rằng việc nghiên cứu thống kê là công cụ quan trọng trong

Trang 35

việc tìm hiểu dữ liệu , việc trình chiếu các biểu đồ dữ liệu đó có tác động tới mắt và di chuyển tới não của mỗi người phân tích và kiểm chứng qua lời bình luận khi nghe Việc khám phá ra sức mạnh của phần mềm thống kê và đồ hoạ làm cho nghiên cứu dữ liệu trở nên phổ biến hơn

Tuy vậy, việc sử dụng trình bày đồ hoạ nào còn phụ thuộc vào các thực tể thí nghiệm Thí nghiệm được thực hiện một cách tự nhiên theo đúng thước đo khả năng và số lượng dữ liệu thu thập được Một số dạng trình bày đồ hoạ thường dùng theo biểu đồ là: hộp đồ thị, chấm đồ thị, biểu đồ X-Y, đồ thị lõi tiêu chuẩn, biểu đồ điều khiển, biểu

đồ chuỗi thời gian, biểu đồ tác động qua lại và biểu đồ Q-Q (quantile – quantile) hầu

hết được sử dụng trong nghiên cứu hoá học Một số bài trình bày dữ liệu ảnh sẽ được

sử dụng ở các ví dụ trong bài này

Một trong những đồ thị dữ liệu được sử dụng nhiều và đơn giản nhất là dotplot (

chấm đồ thị) Mỗi chấm thể hiện độ tin cậy về vị trí riêng biệt của dữ liệu cần trình bày Chấm đồ thị được minh hoạ ở hình 2.1, gồm một trục nằm ngang (hoặc trục dọc) Các giá trị kết quả thí nghiệm cụ thể đựợc biểu diễn bằng một chấm hoặc một kí tự thích hợp trên trục Đồ thị chấm được dùng khi so sánh giá trị đo lường của hai hay nhiều dữ liệu đặt ra Ví dụ sau sẽ chỉ rõ:

Bên cạnh đó, đồ thị hộp là một loại đồ thị không có trong EDA nhưng rẩt hữu ích, đựợc minh hoạ ở hình 2.2 Đồ thị hộp có tác dụng minh hoạ mở rộng các dữ liệu hữu ích cho việc xác nhận bên ngoài (xem phần 4) Đồ thị tương ứng với một cái hộp đặt ở mức thấp hơn (Q1 , 25% của dữ liệu ở dưới số lượng này) và ở mức cao hơn (Q3, 25% của dữ liệu ở trên số lượng này), nơi mà đường thẳng cắt bên trong hộp đánh dấu

vị trí trung tuyến (median) ( theo dõi hộp 2.1) Phần ria đuôi được sử dụng để nối

mép hộp với giá trị kế cận tương ứng với số lượng không có trong Q1- 1,5 (Q3 - Q1)

và Q3 + 1,5 (Q3 – Q1)

Trang 36

Việc sử dụng đồ thị hộp để đánh giá, mở rộng và minh hoạ hình 2.2 đã thể hiện 3

phần liên quan giống nhau Ở phần 1, trung tuyến (median) nằm ở giữa hộp và các

đường thẳng ria bên ngoài dài ngang nhau cho biết số liệu cân xứng Phần 2, dữ liệu

lệch sang bên phải (mean > median), trung tuyến (median) nằm gần số lượng thấp hơn

với đồ thị dạng đường ria bên trái ngắn, bên phải dài Phần 3 tương ứng dữ liệu

nghiêng sang trái (mean < median), trung tuyến (median) gần số lượng cao hơn và có

liên quan với đồ thị hộp biểu diễn đường ria trái dài, ria phải ngắn

Hình 2.3 cung cấp hình ảnh về khái niệm dữ liệu nghiêng Dữ liệu nghiêng sang phải nghĩa là thấp hơn về mặt phép đo, phép đo lớn hơn cũng xuất hiện trong dữ liệu Vì thế, khi đường ria dài tới bên phải được định nghĩa là dữ liệu nghiêng sang phải Ngược lại, dữ liệu nghiêng sang trái được coi là tận cùng của sự kết hợp phép đo dù xuất hiện số liệu nhỏ hơn phép đo cũng xuất hiện trong các dữ liệu Do đó có nhiều dữ

liệu ở phía cuối bên trái được định nghĩa là độ lệch trái (Left- skew) Và độ lệch của

dữ liệu được xác định bởi các số liêu thống kê sau:

n (x-x) 2 (n-1)(n-2)s 3

Theo đó 1 vài giá trị âm ở dữ liệu lệch trái, giá trị dương ở dữ liệu lệch phải và những giá thị gần 0 được coi là dữ liệu đối xứng

Trang 37

Ví dụ 2.1

Tổng các số đo Nitơ Kjeldahl trong bảng 2.1 được đo từ các mẫu nước thải ở đầu ra của 1 nhà máy xử lý phép đo sử dụng phương pháp tiêu hóa Kjeldahl trong 1mgl-1N Việc thăm dò phân tích ,đánh dấu dữ liệu

Bảng 2.1 : tổng các phép đo Nitơ Kjeldahl (TKN) cho ví dụ 2.1

11.6 39.2 4.9 7.3 50.6 9.8 11.6 6.7 42.1 14.4 5.1 48.8 15.9

Tài liệu : A Cerda,M.T.Oms, R.Forteza và V.Cerda, Analyst(cambridge),1996,121,13

Chương trình Exel sẽ xử lý các điểm dữ liệu được trình bày trong output 2.1, trong đó cột dọc được sử dụng cho phép đo thực nghiệm xuất hiện 2 nhóm khác biệt của phép

đo, Một nhóm ở trong khoảng 10 mgl-1

N và 1 nhóm khác ở giữa khoảng40 và 50 mgl1

-N Không xuất hiện phép đo mẫu nước thải ở vị trí chính giữa Phần lớn các phép đo

nằm ở phía cuối của quy mô chỉ ra dữ liệu lệch phải ( right- skew) Đó là sự biến đổi

lớn trong tổng số dữ liệu Nito Kjeldahl ( TKN ) được chứng minh bởi sự đa dạng của phép đo đã trình bày ở trên

Ví dụ 2.2

Output 2.1 : Đánh dấu tổng các phép đo Nito của ví dụ 2.1

Dữ liệu tổng Nito ở trong ô A1:A14 (Nhãn A1) Kích vào chartwizard và chọn ô

A18

Chartwizard step 1 of 5 : chọn và kéo đến ô A1:A14 rồi chọn Next

Chartwizard step 2 of 5 : chọn Line rồi ấn Next

Chartwizard step 3 of 5 : chọn Line chart 3 rồi ấn Next

Chartwizard step 4 of 5 : cho 1 loạt dữ liệu, chọn Rows, rồi ấn Next

Trang 38

Chartwizard step 5 of 5 : cộng thêm ghi chú, chọn No rồi chọn hộp Chart Title và ấn

Plot of Total Nitrogen Measurements, rồi chọn hộp Axis Title Value( Y) rồi ấn Total Nitrogen, cuối cùng ấn Finish

Nhấn chuột đúp vào điểm đánh dấu, nhấn đúp vào hộp X trong thư mục Format Axis,

rồi chọn Scale và ấn vào Value(Y) Axis crosses between Categories, rồi chọn OK

Sửa đổi các điểm bằng cách nhấn chuột đúp vào điểm đó và sửa 1 loạt dữ liệu trong hộp thoại được cung cấp

Hai chất xúc tác ảnh hưởng đến thành phần của 1 hợp chất trong hỗn hợp 3 chất lỏng

là được khảo sát (điều tra) Những thành phần có trong 100ml, được giới thiệu trong bảng 2.2

Output 2.2 : đánh dấu những phép đo thành phần cho ví dụ 2.2

Dữ liệu chất xúc tác A trong ô A1:A11(Nhãn A1) và dữ liệu chất xúc tác B trong ô

B1:B11(Nhãn B1) Chọn Chartwizard rồi ấn vào ô C1

Chartwizard step 1 of 5 : cho vùng ảnh hưởng chọn và kéo ô A1:B11 rồi chọn Next Chartwizard step 2 of 5 : chọn Line rồi ấn Next

Chartwizard step 3 of 5 : chọn Line Chart 3 rồi ấn Next

Chartwizard step 4 of 5 : cho 1 loạt dữ liệu, chọn Rows, rồi ấn Next

Chartwizard step 5 of 5 : cộng thêm ghi chú, chọn No, chọn hộp thoại Chart Title và

ấn Plot of Concentration Measurements Against Catalyst, chọn hộp thoại Axis

Trang 39

Titles Category(X) và ấn catalysts, rồi chọn hộp thoại Axis Titles Value( Y) và ấn Concentration và cuối cùng chọn Finish

Nhấn chuột đúp vào điểm đánh dấu ,ấn chuột đúp vào trục X trong hộp thoại Format

Axis, rồi chọn Scale và ấn Value(Y) Axis Crosses between Catagories, rồi chọn

OK

Nhấn đúp chuột vào trục Y trong thư mục Format Axis, chọn Scale và thay

minimum bằng 53.5 rồi chọn OK Những điểm sửa đổi như ở trên output 2.1

Khảo sát dữ liệu phân tích – dữ liệu sơ đồ

Thiết bị 2.2 bao gồm một sơ đồ đơn giản của 2 bộ dữ liệu trong phần mềm Excel Ta

có thể thấy tập hợp kết quả từ hai xúc tác khác nhau và sản phẩm có liên quan đến bộ

dữ liệu hệ thống Xúc tác A tập trung cao hơn được so sánh với với xúc tác B mặc dù chúng giống nhau trong giá trị đo Hơn thế nữa, ta cũng thấy giá trị đo không những biến đổi nhiều hơn trong xúc tác A (phạm vi biến đổi rộng), từ đó là điểm để xúc tác B xuất hiện

2.2 Ghi số liệu tóm tắt

Ghi lại số liệu hoá học là bước đầu tiên trong quá trình phân tích Bước thứ hai yêu cầu xác định tóm tắt số liệu đo, được đánh dấu kĩ bởi đo trực tiếp Hai cơ sở hình thành của phép đo này nói chung là sử dụng một công cụ đo của đơn vị cơ bản và một công cụ đo lường biến đổi Sự hình thành đựơc chia cho một giá trị đo dơn giản, đặc biệt là vị trí trung tâm của bộ dữ liệu, tương ứng với giá trị đo mà số liệu tập trung lại Giá trị trung bình, hoặc điểm giữa và số trung vị là hai biến số được sử dụng phổ biến cho phân tích các số liệu hoá học Nguồn gốc của nó được giải thích trong hộp 2.1 So sánh với giá trị trung bình cộng để ta có thể ước lượng số liệu chính xác của phép đo dơn giản, sự không chính xác của phép đo là do mắc sai số hệ thống

Trang 40

Một phép đo số biến là sử dụng để cung cấp 1 số dữ liệu tóm tắt của giá trị đo tức thời ở đó dữ liệu tập trung xung quanh giá trị trung tâm của nó Sự biến đổi đó được quy định bởi: khoảng, sự chính xác Các phép toán trong xử lí dữ liệu trong hoá học bao gồm: sắp xếp thứ tự, độ lệch chuẩn và độ lệch chuẩn tương dối (RSD), phạm vi của biến số (CoV) Cách tính các giá trị đó được trình bày trong hộp 2.2 Giá trị thấp cho sự chính xác cao Còn giá trị lớn, số liệu có sự phân tán rộng, cho thấy sự biến đổi lớn hoặc sự không chính xác Sai số ngẫu nhiên là nguyên nhân chính gây ra sự không chính xác của các phép đo trong hoá học

Hộp 2.2 Tóm tắt phép đo biến đổi

Sắp xếp theo thứ tự là sự sắp theo thứ tự từ giá trị nhỏ nhát đến giá trị lớn nhất Khi đó việc tính toán sẽ có lợi hơn

Độ lệch chuẩn cung cấp tóm tắt sự biến đỏi của các giá trị đo với giá trị trung bình Công thức tính độ lệch chuẩn của n lần đo được cho bởi công thức sau:

2 2

2

( ) ( )

x x

RSD = 100(s/x)% (2.4)

Lí do bên cạnh việc chia cho n-1 trong phép tinh độ lệch chuẩn, liên quan đến một khái niệm gọi là bậc tự do Nó là tổng độ lệch của mỗi phép đo với giá trị trung bình , luôn luôn bằng 0, kí hiệu là: ∑(xx) = 0 Vì vậy trong một mẫu với n lần quan sát,

sẽ có sẽ có n -1 đơn vị tự do của thông tin hay còn gọi là bậc tự do, giá trị để đánh giá

độ lệch chuẩn Từ đó chúng ta sử dụng n-1 trong phép toán Như vậy, khoa học thống

Ngày đăng: 28/03/2016, 22:07

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w