b. Sai số hệ thống
3.2.3 Tính các đặc trưng thống kê cơ bản
- Số nhỏ nhất (Min) trong dãy phân phối
- Số lớn nhất (Max) trong dãy phân phối
- Số trung bình cộng (M): là đặc trưng biểu hiện khuynh hướng
trung tâm của sự phân phối. + Cơng thức tính: 1 1 2 2 3 3 ... n n f xi i f x f x f x f x M n n
+ Hàm Excel: M = average ({dãy số})
Trong đó: xi là trị số của từng số đo; fi là tần số của các trị số đo; n là tổng các số đo n = f1 + f2 + f3 +…+ fn
- Số trung tâm hay số trung vị (Me): là con số đứng giữa dãy phân
phối và chia dãy đo thành hai phần bằng nhau. Trên đồ thị biểu diễn phân phối tần số, giá trị Me nằm trên trục hoành và ở vào vị trí chia đều dãy phân phối.
+ Cách xác định: nếu dãy phân phối gồm một số lẻ (n= 2k + 1) giá trị thì con số ở vị trí thứ k + 1 là số trung vị. Nếu dãy phân phối gồm một số chẵn (n = 2k) giá trị thì số trung vị sẽ nằm giữa khoảng giá trị của con số thứ k và k + 1.
+ Hàm Excel: -Me = median({dãy số})
- Số trội (Mo): là giá trị phổ biến nhất, có tần số lớn nhất trong
dãy phân phối. Trên đồ thị của dãy phân phối liên tục trị số của Mo ứng với đỉnh cao nhất của đường cong
phân phối thực nghiệm hay nói lên mức độ phân tán của các giá trị xi so với số trung bình tb..
Cơng thức tính: σ = fi(xi-M)2)/nvới n > 30 Hàm Excel: σ = stdev ({dãy số})
- Hệ số biến thiên (cv): là tỷ lệ giữa độ lệch chuẩn và trung bình
cộng. Nó thể hiện mức độ phân tán của các giá trị xi so với trung bình cộng.
Cơng thức tính: cv = 100(σ/M)
- Hệ số bất đối xứng (SK): thể hiện mức độ bất đối xứng của đồ
thị phân phối của dãy số so với đường cong phân phối chuẩn (SK=0). Hệ số bất đối xứng của đồ thị phân phối chuẩn bao giờ cũng nhỏ hơn hệ số bất đối xứng giới hạn trên [S].
Hàm Excel: SK= skew({dãy số})
- Hệ số nhọn (Kurtosis) – Ký hiệu: KU: thể hiện độ nhọn của đồ
thị phân phối của dãy số so với đường cong phân phối chuẩn (KU = 0). Hệ số nhọn của đồ thị phân phối chuẩn bao giờ cũng nhỏ hơn hệ số nhọn giới hạn trên [K].
+ Hàm Excel: KU= kurt({dãy số})
+ Hàm Excel tính giới hạn trên [S] và [K]:
[S] =3*sqrt(6*(n-1)/(n+1)/(n+3)); (sqrt: lấy căn bậc 2) [K] =3*sqrt(24*n*(n-2)*(n-3)/(n-1)^2/(n+3)/(n+5))
- Tìm số lạc trong dãy số theo phương pháp 3σ
Số lạc được coi là những giá trị hoặc quá lớn hoặc quá bé so với
các giá trị cịn lại của tập hợp các kết quả đo, có xác suất xuất hiện rất thấp nhưng ảnh hưởng đến tính chính xác của kết quả nghiên cứu. Do đó,, các phiếu đo có chứa số lạc cần phải được loại bỏ ngay.
Hệ số z của một giá trị xi nào đó được tính theo: zi = |xi- tb|/σ Khi z ≥ 3, tức xi ≤ M – 3.σ hoặc xi ≥ M + 3.σ sẽ bị coi là số lạc với mức tin cậy 99,73% nếu đại lượng thuộc phân bố chuẩn (tài liệu [8]).
Do đó số lạc là những số thỏa điều kiện sau: Số lạc ≤ M - 3.σ và số lạc ≥ M + 3.σ
Những số liệu cịn lại sẽ có giá trị nằm trong phạm vi từ M – 3.σ đến M + 3.σ. Đây cũng được xem là khoảng tin cậy 99,73%.