Trong giới hạn trình bày, người viết không muốn đề cập đến các lý thuyết thống kê quá nhiều mà chỉ nêu ra các lý thuyết thống kê cần thiết để phục vụ cho đề tài, cụ thể các lý thuyết thống kê còn lại được trình bày rất nhiều qua các đầu sách khác nhau.
Lý thuyết thống kê cần thiết để phục vụ đề tài bao gồm:
Hệ thống châm chất trợ keo tụ trong xử lý nước – HV: Phan Bảo Quang – MS: 13390448
46 a. Phân phối chuẩn N , 2:
Biến ngẫu nhiên liên tục X có phân bố chuẩn N , 2 , ký hiệu
, 2
X N s , nếu hàm mật độ có dạng:
2
2 2
( ) 1 ;
2
x
f x e x
với là kỳ vọng và là phương sai của X.
Phân bố chuẩn được Gauss tìm ra năm 1809 nên còn được gọi là phân bố Gauss. Phân bố chuẩn thường gặp trong các bài toán về sai số gặp phải khi đo đạc các đại lượng vật lý, thiên văn,…
Trong thực tế, nhiều biến ngẫu nhiên tuân theo quy luật chuẩn hoặc tiệm cận chuẩn (Định lý giới hạn trung tâm). Chẳng hạn : trọng lượng, chiều cao của một nhóm người nào đó, điểm thi của thí sinh, năng suất cây trồng,…
Tính chất đồ thị của hàm mật độ của phân phối chuẩn:
- Nhận trục x = làm trục đối xứng.
- Nhận trục hoành làm tiệm cận ngang khi x . - Diện tích giới hạn bởi đồ thị và trục hoành bằng 1.
- Đạt cực đại tại x và có giá trị cực đại bằng 1
2 , có hai điểm uốn tại x .
- Khi tăng thì đồ thị dịch sang phải, khi giảm thì đồ thị dịch sang trái.
- Khi tăng thì đồ thị sẽ thấp xuống, khi giảm thì đồ thị cao lên và nhọn hơn.
Hình 4.1: Hàm mật độ của phân phối chuẩn N ; 2
Hệ thống châm chất trợ keo tụ trong xử lý nước – HV: Phan Bảo Quang – MS: 13390448
47
Nếu X X1, 2 là hai biến ngẫu nhiên độc lập có phân bố chuẩn X1~N 1; 12 và
2
2 ~ 2; 2
X N thì tổ hợp tuyến tính bất kỳ của X X1, 2 cũng có phân bố chuẩn, đặc biệt X1X2 ~N 1 2; 1222.
b. Phân phối Student T n :
Biến ngẫu nhiên liên tục T có phân bố Student n bậc tự do, ký hiệu T ~T n ,
nếu hàm mật độ có dạng:
1
2 2
1
2 1 ,
2 n n
f t t t
n n
n
,
trong đó x là hàm Gamma.
Phân phối Student là phân phối của biến ngẫu nhiên biểu diễn giá trị trung bình chưa biết của phân phối chuẩn Gauss.
Người ta chứng minh được rằng nếu Z ~N 0;1 ,V ~n2 , Z và V độc lập thì:
Z ~
T T n
V n
Giá trị tới hạn mức của phân phối Student n bậc tự do ký hiệu t n thỏa mãn: P T t n
Hình 4.2: Hàm mật độ của phân phối Student
Hàm mật độ của phân phối Student là hàm chẵn nên đồ thị đối xứng qua trục tung. Khi số bậc tự do tăng lên, phân bố Student hội tụ rất nhanh về phân bố chuẩn tắcN 0;1 . Do đó, khi n đủ lớn n30, có thể dùng phân bố chuẩn tắc
Hệ thống châm chất trợ keo tụ trong xử lý nước – HV: Phan Bảo Quang – MS: 13390448
48
0;1
N thay cho phân bố Student. Tuy nhiên, khi n nhỏ n30, việc thay thế như trên sẽ gặp sai số lớn.
Hình 4.3: Sự hội tụ về phân phối chuẩn tắc khi tăng số bậc tự do n c. Phân phối
Khi có n biến ngẫu nhiên xi, i = 1,2,…,n, mỗi xi tuân theo phân phối chuẩn N(0,1).
Biến ngẫu nhiên có dạng: 2 2
1 n
i i
x
gọi là phân phối với n bậc tự do.
Phân phối với n bậc tự do là hàm phân phối của biến ngẫu nhiên liên tục với hàm mật độ xác định trên , có dạng :
2 2 1
2
0 0
1 0
2 2
x n
n
x
f x e x x
n
Và được gọi là có phân phối với n – 1 bậc tự do.
Với n bậc tự do, ta có : (n) thì E 2 n D; 2 2n.
Khi n , phân phối có tiệm cận phân phối chuẩn.
4.1.2 Các điều kiện tiền đề
- Thiết bị đo cho ta giá trị điện thế bề mặt và mục tiêu của việc đo đạc là quy đổi giá trị đó thành nồng độ hóa chất trợ keo tụ trong nước. Do thể tích hóa chất trong một lần châm thấp (50l) và thiết bị châm hóa chất pipet có độ chính xác 1.5l nên kết quả đo điện thế bề mặt ít bị ảnh hưởng bởi cách châm
Hệ thống châm chất trợ keo tụ trong xử lý nước – HV: Phan Bảo Quang – MS: 13390448
49
hóa chất, mà sai số của giá trị điện thế bề mặt chủ yếu xuất hiện là sai số ngẫu nhiên.
- Theo giả định về phân phối xác suất đối với sai số khi đo các đại lượng vật lý, tổng thể biến ngẫu nhiên gốc X là giá trị dòng điện bề mặt đo lường theo mV tuân theo phân bố chuẩn N ; 2(sẽ được kiểm định sau) với giá trị kỳ vọng (tương ứng với mỗi lần châm hóa chất) và phương sai2, ta có các nhận định như sau:
o Để tiết kiệm thời gian, ta đặt trường hợp số lượng mẫu ở một nồng độ cố định sẽ là một số tự nhiên n < 30, lúc này, tổng số lượt ta thực hiện theo như phương pháp lấy mẫu ban đầu sẽ là 100n3000 lượt thử.
o Giá trị kỳ vọng cho mỗi lần châm hóa chất xem như chưa biết.
o Do thiết bị đo có cấp chính xác 0.1%, giá trị điện thế bề mặt có thể được tính như sau: uud ud, với u là giá trị đo điện thế bề mặt và ud là giá trị danh định, hiển thị trên thiết bị đo, do đó, độ lệch chuẩn cho mỗi giá trị đo (tương ứng mỗi lần châm hóa chất) là khác nhau, ta xem như phương sai 2 chưa biết.
4.1.3 Tính toán số lượng mẫu thực nghiệm cần thiết
Theo các điều kiện tiền đề, ta thiết lập hệ thống mẫu thực nghiệm dưới trường hợp phương sai 2chưa biết, kích thước mẫu cho mỗi giá trị đo (ví dụ như ở lần châm thứ 2 trong 100 lần, ta có n mẫu khác nhau) là n < 30.
Yêu cầu về độ tin cậy và độ chính xác của ước lượng được đề ra như sau:
a. Độ tin cậy = 0.95, hay = – 1 = 0.05 b. Độ chính xác 0 3 (mV).
Số lượng mẫu cần thiết là số tự nhiên n nhỏ nhất thỏa mãn:
2
/2 0
. done 1 S t n
n
,
với: 2 2
1
1 1
ndone
i i
done i
S S r X X
n
: độ lệch tiêu chuẩn mẫu.
Hệ thống châm chất trợ keo tụ trong xử lý nước – HV: Phan Bảo Quang – MS: 13390448
50 và t/ 2ndone1 là tới hạn mức
2
của phân bố Student (ndone – 1) bậc tự do.
Chọn số lượng tính là 3 mẫu thực nghiệm đầu tiên, ta có ndone = 3.
- Đối với độ lệch chuẩn mẫu S, ta chọn giá trị lớn nhất tương ứng dãy số liệu ứng với mỗi lần châm khác nhau. Giá trị S đã được tính toán: S = 2.9059.
- t/ 2ndone 1 t0.025 2 4.303
Vậy, số mẫu cần thử nghiệm n là n17.37, ta chọn n = 18.
Số liệu thu thập được (sau khi khử sai số thô) bao gồm 18 lượt thử, mỗi lượt châm 100 lần hóa chất PAC với nồng độ PAC trong nước tăng dần, mỗi lần châm 50l PAC 3%.