1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Giáo trình xử lý số liệu và quy hoạch thực nghiệm hóa học

299 28 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Giáo Trình Xử Lý Số Liệu Và Quy Hoạch Thực Nghiệm Hóa Học
Tác giả TS. Lê Đình Vũ
Trường học Đại Học Công Nghiệp Thành Phố Hồ Chí Minh
Chuyên ngành Hóa Phân Tích và Công Nghệ Hóa Học
Thể loại Giáo Trình
Thành phố Thành Phố Hồ Chí Minh
Định dạng
Số trang 299
Dung lượng 12,75 MB

Cấu trúc

  • Chương 1: Đại lượng đặc trưng của tập số liệu thực nghiệm (10)
    • 1.1. Đại lượng đặc trưng cho tâm phân bố và vị trí của tập số liệu (10)
    • 1.2. Đại lượng đặc trưng cho sự phân tán của tập số liệu thực nghiệm (14)
      • 1.2.1. Phương sai (14)
      • 1.2.2. Độ lệch chuẩn (14)
      • 1.2.3. Độ sai chuẩn/độ lệch chuẩn trung bình (14)
      • 1.2.4. Khoảng biến thiên (15)
      • 1.2.5. Độ lệch chuẩn tương đối/hệ số biến sai (15)
    • 1.3. Sai số đo lường (17)
      • 1.3.1. Sai số tuyệt đối (17)
      • 1.3.2. Sai số tương đối (17)
      • 1.3.3. Sai số hệ thống (18)
      • 1.3.4. Sai số ngẫu nhiên (18)
    • 1.4. Ứng dụng Excel trong tính toán đại lượng đặc trưng của tập số liệu thực nghiệm (19)
      • 1.4.1. Ứng dụng hàm Excel tính các thông số của tập số liệu (19)
      • 1.4.2. Công cụ Excel mô tả tập số liệu thực nghiệm (22)
  • Tài liệu tham khảo (26)
    • Chương 2: Hàm phân phối xác suất và chuẩn thống kê (27)
      • 2.1. Phân phối xác suất Gauss và chuẩn Z (27)
        • 2.1.1. Cơ sở thống kê và ứng dụng phân phối Gauss (27)
        • 2.1.2. Tính toán phân phối Gauss bằng hàm Excel (29)
      • 2.2. Phân phối Student và chuẩn t (32)
        • 2.2.1. Cơ sở thống kê và ứng dụng phân phối Student (32)
        • 2.2.2. Hàm Excel tính toán phân phối Student (34)
      • 2.3. Phân phối Fisher và chuẩn F (36)
        • 2.3.1. Cơ sở thống kê và ứng dụng phân phối Fisher (36)
        • 2.3.2. Tính toán phân phối Fisher bằng hàm Excel (38)
      • 2.4. Phân phối Chi bình phương và chuẩn χ2 (39)
        • 2.4.1. Cơ sở thống kê và ứng dụng phân phối Chi bình phương (39)
        • 2.4.2. Tính toán phân phối Chi bình phương bằng hàm Excel (41)
      • 2.5. Phân phối Tam giác cân (41)
      • 2.6. Phân phối Hình chữ nhật (43)
    • Chương 3: Kiểm định thống kê và ứng dụng (47)
      • 3.1. Giả thuyết thống kê và kết luận thống kê (47)
        • 3.1.1. Giả thuyết thống kê (47)
        • 3.1.2. Kết luận thống kê (47)
        • 3.1.3. Mối quan hệ giữa chuẩn thống kê và kết luận thống kê (49)
      • 3.2. Kiểm định Student và ứng dụng (50)
        • 3.2.1. Kiểm định Student so sánh giá trị trung bình của một tập số liệu với giá trị cho trước (51)
        • 3.2.2. Kiểm định Student liên quan từng đôi một (55)
        • 3.2.3. Kiểm định Student cho hai mẫu có phương sai đồng nhất (60)
        • 3.2.4. Kiểm định Student cho hai mẫu không đồng nhất phương sai (63)
      • 3.3. Kiểm định Gauss và ứng dụng (66)
        • 3.3.1 Kiểm định Z cho một tập mẫu (66)
        • 3.3.2. Kiểm định Z cho hai tập mẫu (67)
        • 3.3.3. Ứng dụng kiểm định Z trong đánh giá kết quả thử nghiệm thành thạo (69)
        • 3.3.4. Ứng dụng kiểm định Z xây dựng biểu đồ kiểm soát (77)
      • 3.4. Kiểm định Grubbs và ứng dụng (78)
      • 3.5. Kiểm định Fisher (F–test) và ứng dụng (81)
      • 3.6. Kiểm định Chi bình phương (χ2–test) và ứng dụng (85)
        • 3.6.1. Kiểm định Chi bình phương đánh giá tương quan giữa các yếu tố không qua tham số (86)
        • 3.6.2. Kiểm định Chi bình phương đánh giá đồng nhất phương sai mẫu và phương sai chuẩn cho trước (89)
      • 3.7. Kiểm định Cochran và ứng dụng (92)
    • Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích (99)
      • 4.1. Tính đặc hiệu, tính chọn lọc (99)
        • 4.1.1 Tính đặc hiệu (99)
        • 4.1.2. Tính chọn lọc (102)
      • 4.2. Khoảng tuyến tính, độ tương quan của đường hiệu chuẩn (102)
        • 4.2.1. Đường hiệu chuẩn (102)
        • 4.2.2. Độ tuyến tính (105)
      • 4.3. Giới hạn phát hiện, giới hạn định lượng (110)
        • 4.3.1. Tính LOD dựa trên độ lệch chuẩn khi phân tích lặp mẫu trắng (111)
        • 4.3.2. Xác định LOD/MDL bằng phân tích mẫu thêm chuẩn, mẫu thật (111)
        • 4.3.3. Tính LOD/MDL dựa trên S/N (113)
        • 4.3.4. Tính LOD từ đường hiệu chuẩn (114)
        • 4.3.5. Xác định LOD/MDL dựa trên mức tin cậy của tín hiệu (0)
      • 4.4. Độ chính xác của phương pháp phân tích (114)
        • 4.4.1. Độ chụm, độ lặp của phương pháp (115)
        • 4.4.2. Độ đúng (120)
      • 4.5. Độ không đảm bảo đo (123)
        • 4.5.1. Số đo và chữ số có nghĩa (123)
        • 4.5.2. Sai số tích lũy (126)
        • 4.5.3. Độ không đảm bảo đo (129)
        • 4.5.4. Quy trình xác định độ không đảm bảo đo (130)
        • 4.5.5. Một số ví dụ (143)
      • 5.1. Phân tích phương sai một yếu tố (160)
      • 5.2. Phân tích phương sai hai yếu tố không lặp (166)
      • 5.3. Phân tích phương sai hai yếu tố có lặp (173)
      • 5.4. Phân tích phương sai ba yếu tố trở lên (181)
        • 5.4.1. Phân tích phương sai ba yếu tố không có lặp (183)
        • 5.4.2. Phân tích phương sai ba yếu tố có lặp (187)
    • Chương 6: Thiết kế và phân tích thực nghiệm (159)
      • 6.1. Cơ sở lý thuyết về thiết kế và phân tích thực nghiệm (198)
        • 6.1.1. Vai trò của thiết kế và phân tích thực nghiệm (198)
        • 6.1.2. Thiết kế ma trận thực nghiệm (200)
        • 6.1.3. Thực nghiệm theo ma trận thiết kế (0)
        • 6.1.4. Tính toán hệ số của phương trình hồi quy (0)
        • 6.1.5. Đánh giá hệ số hồi quy (0)
        • 6.1.6. Đánh giá phương trình hồi quy (0)
      • 6.2. Mô hình hóa thực nghiệm bậc một (0)
        • 6.2.1. Mô hình hóa thực nghiệm bậc một đầy đủ (0)
        • 6.2.2. Mô hình hóa thực nghiệm bậc một rút gọn (0)
      • 6.3. Mô hình mặt đáp ứng bậc hai (0)
        • 6.3.1. Mô hình bậc hai tâm trực giao (0)
        • 6.3.2. Mô hình bậc hai tâm xoay (0)
      • 6.4. Mô hình thực nghiệm dạng hỗn hợp (0)
        • 6.4.1. Ma trận thực nghiệm của mô hình hỗn hợp (0)
        • 6.4.2. Tính toán phương trình hồi quy (0)
        • 6.4.3. Đánh giá tính phù hợp của phương trình hồi quy (0)
      • 6.5. Mô hình đa mức thực nghiệm (0)
  • Phụ lục (0)

Nội dung

Đại lượng đặc trưng của tập số liệu thực nghiệm

Đại lượng đặc trưng cho tâm phân bố và vị trí của tập số liệu

Giá trị trung bình (Mean) là trung bình cộng của một tập số liệu, ký hiệu là x x = 1

Giá trị trung bình của một tập số liệu thể hiện tâm của tập dữ liệu đó Tâm của tập số liệu thường bị lệch về phía các giá trị có tần suất cao Khi số lượng dữ liệu trong tập số liệu tăng lên vô hạn (N→ ∞), giá trị trung bình sẽ tiến gần hơn đến giá trị thực.

Giá trị trung bình đóng vai trò quan trọng trong việc đánh giá tập số liệu, đặc biệt trong kiểm soát chất lượng (QA/QC) và đảm bảo chất lượng trong hoạt động kiểm nghiệm và đo lường Nó thường được sử dụng để đánh giá độ đúng của phương pháp phân tích (trueness), đánh giá tay nghề nhân viên kiểm nghiệm, và thực hiện thử nghiệm thành thạo (Proficiency testing – PT).

Khoảng giá trị (Range) là khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất của tập số liệu kết quả đo

Số trung vị (Median, Med) là giá trị nằm ở vị trí giữa của một tập hợp số liệu khi được sắp xếp theo thứ tự tăng dần Nếu số lượng dữ liệu (N) là lẻ, trung vị sẽ là giá trị ở giữa; còn nếu N là chẵn, trung vị sẽ là trung bình cộng của hai giá trị ở vị trí giữa.

Khi giá trị trung vị gần bằng giá trị trung bình, điều này cho thấy tập số liệu có sự phân bố đều trong khoảng giá trị Nếu giá trị trung vị nhỏ hơn giá trị trung bình, điều này chỉ ra rằng tập số liệu có xu hướng lệch về phía các giá trị nhỏ Ngược lại, nếu trung vị lớn hơn trung bình, tập số liệu có xu hướng lệch về phía các giá trị lớn.

Trong phân tích thống kê, đặc biệt là trong kỹ thuật phân tích dữ liệu lớn, việc xử lý nhiều tập dữ liệu thành phần nhằm loại bỏ giá trị bất thường là rất quan trọng Trung vị được sử dụng như giá trị khởi đầu cho các phép tính lặp, giúp xác định giá trị trung bình hoặc độ lệch chuẩn đặc trưng nhất cho tập dữ liệu.

Tần số (Frequency, f) của giá trị/nhóm giá trị là số lần xuất hiện giá trị/nhóm giá trị đó trong tập số liệu thực nghiệm

Tần suất (p i) của một giá trị hoặc nhóm giá trị (xi) được xác định bằng tỷ lệ giữa số lần xuất hiện của giá trị hoặc nhóm giá trị đó (f) và tổng số liệu thực nghiệm (N) Công thức tính tần suất là p i = f/N.

N vì 0  f  N nên 0  pi  1 (1.4) Khi tập số liệu đủ lớn (N → ) tần suất pi được xem là xác suất xuất hiện của giá trị xi (Probability, p)

Phân phối tần suất là đồ thị thể hiện mối quan hệ giữa tần suất và các giá trị trong tập số liệu thực nghiệm Nó giúp đánh giá mức độ tái hiện của các giá trị đo lường trong tập dữ liệu Tần số, tần suất và phân phối tần suất đóng vai trò quan trọng trong các nghiên cứu khảo sát trong lĩnh vực hóa học và hóa phân tích, đặc biệt là trong việc đánh giá chất lượng sản phẩm.

Tần số, tần suất và phân phối tần suất thường được áp dụng cho nhóm giá trị nhỏ trong toàn bộ khoảng dữ liệu Các nhóm này có thể được phân chia theo nhiều khoảng khác nhau, tùy thuộc vào đặc điểm và yêu cầu của từng bài toán thực nghiệm.

Số trội (Mode) là giá trị/nhóm giá trị trong tập số liệu có tần suất cao nhất

Ví dụ 1.1: Kết quả phân tích hàm lượng lipit tổng số (g/kg) trong 40 mẫu sữa bột thu được như bảng sau:

– Xác định khoảng giá trị, trung vị, giá trị trung bình của tập số liệu

Để xác định tần suất, số trội và phân phối tần suất của tập giá trị, chúng ta cần sử dụng khoảng giá trị là 2g/kg Việc mô tả phân phối tần suất của tập số liệu sẽ được thực hiện thông qua đồ thị, giúp trực quan hóa và phân tích dữ liệu một cách hiệu quả.

Giải: Tập số liệu được sắp xếp lại theo thứ tự tăng dần, kết quả thu được như bảng dưới đây:

Khoảng giá trị: R = xmax – xmin = 27.9 – 18.3 = 9.6

Ta thấy trung vị của tập số liệu có giá trị gần bằng giá trị trung bình, tập số liệu phân bố tương đối đều về hai phía

Các giá trị được phân loại thành các nhóm theo yêu cầu Tần số và tần suất được tính toán dựa trên các khoảng giá trị Kết quả được thể hiện trong bảng dưới đây.

Nhóm Khoảng nồng độ (g/kg) Tần số Tần suất (%)

Giá trị tần suất theo nhóm được thể hiện trên đồ thị ta thu được phân phối tần suất như hình 1.1

Hình 1.1 Đồ thị mối quan hệ giữa tần suất các giá trị theo các nhóm nồng độ lipit có trong 40 mẫu sữa bột: nhóm 1: 18.0 – 20.0; nhóm 2: 20.1 – 22.0; nhóm

Hình 1.2 Đồ thị tần suất dồn theo các nhóm nồng độ lipit có trong 40 mẫu sữa bột Nhóm 1: 18.0 – 20.0; nhóm 2: 18.0 – 22.0; nhóm 3: 18.0 – 24.0; nhóm 4:

Số trội trong tập số liệu được xác định là nhóm mẫu có nồng độ từ 22.1–24.0 g/kg, với tần suất cao nhất đạt 30% Ngược lại, nhóm có nồng độ cao nhất từ 18.1–20.0 g/kg lại có tần suất thấp nhất, chỉ đạt 12.5%.

Đại lượng đặc trưng cho sự phân tán của tập số liệu thực nghiệm

Tổng bình phương sai khác (SS) là tổng của các bình phương chênh lệch giữa từng giá trị trong tập số liệu và giá trị trung bình của tập số liệu.

Phương sai của một tập số liệu được tính bằng trung bình của tổng bình phương sai khác giữa các giá trị trong tập số liệu và giá trị trung bình của nó, với N là số lượng kết quả đo.

Bậc tự do của tập số liệu kết quả đo được ký hiệu là f, trong đó f thường bằng N – 1 Khi số thực nghiệm đủ lớn (N ≥ 30), f gần bằng N, và phương sai của tập mẫu (S²) trở thành phương sai tổng thể, ký hiệu là σ².

Phương sai là chỉ số đo lường độ phân tán, độ chụm và độ lặp của các giá trị so với trung tâm của tập dữ liệu thực nghiệm (x) Khi phương sai nhỏ, điều này cho thấy độ phân tán giữa các giá trị cũng nhỏ, dẫn đến độ lặp và độ chụm cao hơn, và ngược lại, phương sai lớn sẽ phản ánh sự phân tán cao hơn.

Phương sai là một công cụ quan trọng trong xử lý số liệu, được sử dụng để tính khoảng biến thiên của kết quả đo lường (ε), đánh giá độ lặp và độ tái lặp của phương pháp phân tích, cũng như ước lượng độ không đảm bảo đo Ngoài ra, nó còn giúp đánh giá độ ổn định của thiết bị đo, năng lực tay nghề của nhân viên kiểm nghiệm và mức độ tác động của các yếu tố vào giá trị cần khảo sát.

1.2.2 Độ lệch chuẩn (Standard deviation, S d ) Độ lệch chuẩn của một tập số liệu là căn bậc hai giá trị phương sai của tập số liệu:

Độ lệch chuẩn (σ) được tính bằng căn bậc hai của phương sai (σ²), tức là σ = √σ² Độ lệch chuẩn có cùng đơn vị với dữ liệu trong tập số liệu và mang ý nghĩa tương tự như phương sai, giúp đánh giá mức độ phân tán của dữ liệu.

1.2.3 Độ sai chuẩn/độ lệch chuẩn trung bình (Standard error, 𝑺 𝒙 ̅ ) Độ sai chuẩn là tỉ số giữa độ lệch chuẩn và căn bậc hai của số giá trị trong tập số liệu:

Độ sai chuẩn, ký hiệu là N(N−1), là độ lệch chuẩn trung bình có cùng thứ nguyên và ý nghĩa với độ lệch chuẩn Nó được sử dụng để biểu diễn khoảng biến thiên chuẩn của giá trị thực, cũng như để tính khoảng biến thiên mở rộng của tập giá trị thực nghiệm với một độ tin cậy nhất định.

1.2.4 Khoảng biến thiên (Confidence level, ε)

Khoảng biến thiên là khoảng dao động của giá trị thực (à) tính từ tâm của tập số liệu (x) Tập số liệu thực nghiệm bao gồm các giá trị rời rạc thu được từ những lần đo cụ thể và độc lập Qua các phép tính thống kê, chúng ta có thể mô tả giá trị thực nghiệm bằng một khoảng giá trị liên tục với độ tin cậy nhất định, được biểu diễn dưới dạng: à = x ± ε hay x – ε ≤ à ≤ x + ε.

Với ε = k S X ̅ trong đó k là hệ số phủ, hệ số phủ k sẽ khác nhau tùy thuộc vào quy luật phân bố ở một độ tin cậy nhất định

1.2.5 Độ lệch chuẩn tương đối/hệ số biến sai (Relative standard deviation, RSD%) Độ lệch chuẩn tương đối hay hệ số biến thiên là tỉ số giữa độ lệch chuẩn với giá trị trung bình:

RSD (%) thường được sử dụng để đánh giá độ lặp của phương pháp đo lường, bao gồm độ lặp trung gian và độ tái lặp nội bộ Giá trị RSD chấp nhận được có thể khác nhau tùy thuộc vào hệ thống tiêu chuẩn, đối tượng phân tích và nồng độ định lượng.

Để đánh giá tay nghề của kiểm nghiệm viên trong phòng thí nghiệm, bộ phận đảm bảo chất lượng đã tạo mẫu và yêu cầu các kiểm nghiệm viên phân tích trên cùng một mẫu kiểm soát Kết quả nồng độ (mg/Kg) thu được từ các kiểm nghiệm viên A, B, C và D được trình bày trong bảng dưới đây.

Để đánh giá tay nghề của các kiểm nghiệm viên, cần tính toán các đại lượng như phương sai, độ lệch chuẩn, độ sai chuẩn và hệ số biến sai cho từng nhân viên Nếu hệ số biến sai (RSD) tối đa cho phép là 11%, việc so sánh kết quả tính toán với ngưỡng này sẽ giúp xác định mức độ chính xác và độ tin cậy trong công việc của họ.

– Tính phương sai tổng hợp cho tập số liệu của cả 4 nhân viên trên và biểu diễn kết quả cuối cùng nếu chấp nhận khoảng biến thiên ε = ±3Sd

Giải: Áp dụng công thức tính x, S 2 , Sd, S x̅ , và RSD lần lượt cho từng nhân viên, kết quả thu được như bảng sau: Đại lượng KNV A KNV B KNV C KNV D

Giá trị trung bình (x) 0.836 0.800 0.760 0.775 Phương sai (S 2 ) 0.0013 0.0043 0.0034 0.0054 Độ lệch chuẩn (S d ) 0.0357 0.0658 0.0582 0.0732 Độ sai chuẩn (S x̅ ) 0.0146 0.0249 0.0238 0.0277

Kết quả cho thấy mức độ thành thạo của các nhân viên được xếp hạng từ thấp đến cao là D, B, C, A, với sự chênh lệch nhỏ hơn 11% Tất cả các nhân viên có tay nghề đều đạt yêu cầu.

– Tập số liệu phân tích mẫu gộp gồm 26 giá trị, giá trị trung bình của tập mẫu này là: x =N A x̅ A + N B x̅ B + N C x̅ C + N D x̅ D

6 + 7 + 6 + 7 ≈ 0.79 mg/kg Áp dụng công thức 1.6 tính phương sai của tập số liệu gộp 4 tập con của nhân viên A, B, C, D

Vì vậy nồng độ của tập số liệu được biểu diễn là 0.79 ± 0.04 mg/kg.

Sai số đo lường

Sai số đo lường là sự khác biệt giữa giá trị đo được và giá trị thực hoặc giá trị trung bình Dựa trên công thức tính toán, sai số được chia thành sai số tuyệt đối và sai số tương đối Ngoài ra, theo nguyên nhân và nguồn gốc, sai số có thể được phân loại thành sai số hệ thống và sai số ngẫu nhiên.

Sai số tuyệt đối là sự chênh lệch giữa giá trị đo được trong một lần đo và giá trị trung bình hoặc giá trị thực Sai số này có cùng đơn vị với giá trị cần đo và có thể mang giá trị âm hoặc dương Công thức tính sai số tuyệt đối được thể hiện như sau:

Sai số tương đối là tỷ lệ giữa sai số tuyệt đối và giá trị trung bình, được biểu thị bằng phần trăm (%) Công thức tính sai số tương đối như sau:

Sai số tương đối là một chỉ số quan trọng trong việc đánh giá độ chính xác của các phép đo và phương pháp phân tích Nó cũng được áp dụng trong việc tính toán sai số tổng hợp khi có nhiều sai số thành phần khác nhau về thứ nguyên.

Sai số hệ thống (System error) là sai số trong phép đo do các yếu tố như tính chất mẫu, thiết bị, hóa chất, điều kiện môi trường và phương pháp đo lường hoặc do người thực hiện gây ra Giá trị của sai số hệ thống thường có dấu nhất định, có thể dương hoặc âm, và thể hiện xu hướng chung khi thực hiện nhiều phép đo, như giữ nguyên, tăng dần hoặc giảm dần Thông thường, giá trị của các phép đo bị sai số hệ thống sẽ lệch về một phía so với giá trị tham chiếu hoặc giá trị thực.

Mặc dù sai số hệ thống có nguyên nhân cụ thể, nhưng hầu hết các phép đo đều gặp phải loại sai số này Do đó, việc kiểm soát và cải tiến để giảm thiểu sai số hệ thống trong các phép đo là rất cần thiết.

Sai số hệ thống là một chỉ số cực kỳ quan trọng trong phân tích và đo lường Để kiểm soát sai số hệ thống của phương pháp, cần thực hiện các phép đo song song trên vật liệu chuẩn, mẫu chuẩn, mẫu thêm chuẩn, mẫu trắng, hoặc tiến hành so sánh liên phòng và thử nghiệm thành thạo.

Hiệu suất thu hồi là chỉ số quan trọng phản ánh sai số hệ thống của phương pháp phân tích Không có phương pháp nào đạt hiệu suất thu hồi 100% mà không mắc sai số Sai số hệ thống chủ yếu đến từ nền mẫu phân tích và phương pháp thực hiện, trong đó giai đoạn xử lý mẫu thường quyết định giá trị hiệu suất thu hồi.

Sai số ngẫu nhiên là loại sai số phát sinh từ các yếu tố ngẫu nhiên không xác định được nguyên nhân cụ thể Khi thực hiện các phép đo lặp lại trong cùng một điều kiện, sai số ngẫu nhiên luôn xuất hiện Tập số liệu có sai số ngẫu nhiên thường biểu hiện với các giá trị phân bố đều về hai phía của giá trị tham chiếu hoặc giá trị thực.

Ứng dụng Excel trong tính toán đại lượng đặc trưng của tập số liệu thực nghiệm

Hàm thống kê và công cụ thống kê trong Microsoft Excel là công cụ quan trọng giúp tính toán và mô tả các đại lượng thống kê từ tập số liệu thực nghiệm Bài viết này sẽ giới thiệu những hàm và công cụ thống kê cơ bản nhất, phục vụ cho việc tính toán và mô tả các đại lượng thống kê được trình bày trong các mục 1.1 và 1.2.

1.4.1 Ứng dụng hàm Excel tính các thông số của tập số liệu

Giá trị trung bình : Dùng hàm Average với cú pháp fx=AVERAGE(number1, number2, ) Số liệu có thể nhập dạng chuỗi hoặc mảng như hình sau:

To calculate frequency in Excel, utilize the FREQUENCY function with the syntax fx=FREQUENCY(data_array, bins_array) In this formula, data_array refers to the set of data you want to analyze, while bins_array consists of the values for which you want to determine the frequency, serving as a subset of data_array.

Tần suất: Tính bằng phép tính thông thường trên Excel là f/N

Phương sai: Dùng hàm với cú pháp fx=VAR(number1, number2, ) Độ lệch chuẩn: Dùng hàm STDEV với cú pháp fx

Khoảng biến thiên: Dùng hàm CONFIDENCE.T với cú pháp fx=CONFIDENCE.T (alpha, standard_dev, size)

Số trội: Dùng hàm với cú pháp fx=MODE(number1, number2, ) Trung vị: Dùng hàm Median với cú pháp fx=MEDIAN(number1, number2, )

1.4.2 Công cụ Excel mô tả tập số liệu thực nghiệm

Trong Microsoft Excel, các đại lượng thống kê thường được xác định riêng lẻ Tuy nhiên, để mô tả đồng thời các đại lượng thống kê của một tập dữ liệu thực nghiệm, người dùng có thể sử dụng công cụ mô tả thống kê Descriptive Statistics có trong menu Phân tích dữ liệu (Data Analysis).

Trước tiên, cần thực hiện thao tác kích hoạt Analysis ToolPak trong Excel như sau:

1- Lần lượt chọn file/option/Add–Ins/

2- Chọn Excel Add–ins tại hộp thoại Manage chọn Go

3- Hộp thoại Add–ins xuất hiện, chọn Analysis ToolPak và chọn ok

Menu Data Analysis xuất hiện trong Excel (góc phải trên cùng màn hình) sau khi kích hoạt công cụ Analysis ToolPak Để thực hiện mô tả thống kê cho tập số liệu, bạn cần chọn Data Analysis và sau đó chọn Descriptive.

Statistics , bảng nhập dữ liệu xuất hiện:

Thực hiện khai báo bảng Descriptive Statistics gồm hai phần: Input và

Output option Chọn vùng xuất dữ liệu, chọn bảng tổng hợp thống kê

( Summary statistics ) và độ tin cậy 95% ( Confidence Level for Mean ) và chọn ok , kết quả mô tả thống kê của tập số liệu thu được như bảng sau:

Mean Giá trị trung bình

Standard Error Độ sai chuẩn

Standard Deviation Độ lệch chuẩn

Kurtosis Độ nhọn của đỉnh

Minimum Giá trị nhỏ nhất

Maximum Giá trị lớn nhất

Sum Tổng các giá trị

Count Số lượng giá trị

Confidence Level(95.0%) Khoảng biến thiên

Vớ dụ 1.3: Kết quả kiểm soỏt nồng độ bụi chỡ trung bỡnh 24h (àg/m 3 ) trong không khí xung quanh một khu chế xuất thu được như bảng sau:

Sử dụng công cụ Excel để phân tích thống kê dữ liệu, chúng ta đánh giá chất lượng không khí theo tiêu chuẩn bụi chì với độ tin cậy 95% Theo quy chuẩn QCVN05: 2013/BTNMT, nồng độ tối đa cho phép là 1.5 µg/m³.

Sử dụng công cụ Descriptive Statistics để mô tả thống kê theo hướng dẫn ở trên đây ta thu được kết quả như sau:

Kết quả phân tích cho thấy các đại lượng thống kê cơ bản của tập số liệu, với giá trị trung bình là 0.81 àg/m³ và khoảng biến thiên là 0.04 Do đó, nồng độ chì trong không khí được xác định là 0.81 ± 0.04 àg/m³ cho tập số liệu núi Trờn.

Bài tập 1.1 trình bày một tập giá trị thực nghiệm liên quan đến việc kiểm soát hàm lượng kim loại nặng (mg/L) trong nước thải của một khu công nghiệp, với các kết quả được ghi nhận trong bảng dưới đây.

– Xác định khoảng giá trị, trung vị, giá trị trung bình của tập số liệu

– Xác định tần suất, số trội, phân phối tần suất của tập giá trị trên theo khoảng giá trị là 2 mg/L

Bài tập 1.2: Để đánh giá độ lặp lại của phương pháp xác định protein thô (%) trong một loại thực phẩm, tiến hành phân tích lặp 10 lần trên cùng một lượng mẫu, sử dụng phương pháp và thiết bị giống nhau, và kiểm nghiệm trong khoảng thời gian ngắn nhất Kết quả thu được được trình bày dưới dạng một dãy số.

Kết quả thực nghiệm gồm các giá trị: 10.5, 10.7, 10.8, 10.6, 10.4, 10.5, 10.2, 10.5, 10.6, 10.2 Để phân tích, cần tính toán các thông số thống kê cho tập dữ liệu này Sử dụng công cụ Excel để mô tả thống kê cho tập số liệu Nếu độ lặp tiêu chuẩn có RSD ≤ 3%, thì kết quả phân tích sẽ đáp ứng yêu cầu.

Ngày đăng: 03/11/2023, 10:50

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN