Xỏc định giỏ trị bất thường

Một phần của tài liệu Giao trinh thong ke (Trang 28 - 30)

Chương 4 : CÁC PHƯƠNG PHÁP KIỂM TRA THỐNG Kấ

4.2. Xỏc định giỏ trị bất thường

Cú 3 cỏch để loại bỏ giỏ trị bất thường:

Cỏch 1: Quan sỏt một cỏch khỏch quan để tỡm nguyờn nhõn gõy giỏ trị bất thường và loại giỏ trị bất thường.

Cỏch 2: Giữ lại kết quả thực nghiệm khi đó tối thiểu hoỏ ảnh hưởng của cỏc yếu tố khỏch quan và chủ quan bằng cỏch dựng giỏ trị trung vị.

Cỏch 3: Sử dụng chuẩn thống kờ để loại bỏ số liệu bất thường.

Trong 3 cỏch trờn, cỏch 1 và 2 thường được dựng nếu khụng cú định kiến cỏ nhõn.

Thớ dụ khi quan sỏt cỏc số liệu thực nghiệm nếu thấy xuất hiện dấu hiệu bất thường thỡ loại ngay (như màu sắc của dung dịch phõn tớch khỏc màu thường đo…). Tuy nhiờn, trong đa số trường hợp chỳng ta khụng phỏt hiện ra điều bất thường và vẫn tiến hành đo,và vẫn thu được kết quả. Do đú, cỏch khỏc quan là xử lý thống kờ theo ba tiờu chuẩn thống kờ sau đõy.

Nguyờn tắc: Sắp xếp cỏc số liệu thu được theo chiều tăng hoặc giảm dần và dựng Q-test đỏnh giỏ kết quả nghi ngờ khỏc xa bao nhiờu so với số cũn lại trong tập số liệu. Tớnh giỏ trị Q theo biểu thức (1) và so sỏnh với giỏ trị Q chuẩn trong bảng 4.1:

Qtính=

min max x x

x xnghi ngo lan can

− − − −

So sánh Qtính và Qchuẩn (P=0,90; N). Giá trị nghi ngờ sẽ chính là giá trị bất th-ờng nếu Qtính > Qchuẩn (P,N).

Bảng 4.1 : Giá trị chuẩn Q dùng để loại bỏ giá trị bất th-ờng.

N Mức tin cậy 90% 95% 99% 3 0,89 0,94 0,99 4 0,68 0,77 0,89 5 0,56 0,64 0,76 6 0,48 0,56 0,70 7 0,43 0,51 0,64 8 0,47 9 0,44 10 0,41

Chú ý: Nếu số phép đo lớn (N >10) thì cách phát hiện theo chuẩn Q không đủ nhạy, do trong phép kiểm tra này chỉ có giá trị nghi ngờ và hai giá trị khác của phép đo đ-ợc sử dụng. Khi đó, để kiểm tra sự tồn tại của giá trị bất th-ờng, ng-ời ta dùng tiêu chuẩn 2.

Thí dụ 4.1 : Kết quả xác định hàm l-ợng CaCO3 (%) trong một mẫu đolomit thu đ-ợc nh- sau: 54,31;54,36; 54,40; 54,44 ; 54,59 %.

Hãy kiểm tra xem giá trị nghi ngờ 54,99 có phải là giá trị bất th-ờngkhông? Giải: Số gần nhất của 54,99 là 54,44. Ta có: Q= 0,8 31 , 54 99 , 54 44 , 54 99 , 54 = − −

Với 5 lVói 5 lần thí nghiệm và P=0,90 tra bảng chuẩn Q ta đ-ợc Qchuẩn=0,56. vậy Qthực nghiệm >Qchuẩn hay gía trị 54,59 là giá trị bất th-ờng.

* Tiêu chuẩn 2: (áp dụng cho tập số liệu có N>10)

Dựa trên khoảng giới hạn tin cậy: x 2 chứa 95 % số liệu đo đ-ợc với x là giá trị trung bình của tập số liệu (đã loại bỏ số liệu nghi ngờ) và  là độ lệch chuẩn tập hợp. Những giá trị nào ngoài khoảng trên sẽ đ-ợc loại bỏ.

*Tiêu chuẩn 3: Giả sử tập số liệu thực nghiệm đ-ợc sắp xếp theo thứ tự tăng dần xL , x2, …, xH . Tính giá trị trung bình x và độ lệch chuẩn S và kiểm tra các giá trị nghi ngờ theo cách sau:

Tr-ớc tiên tính x x

T H

S x x

TL

= với các giá trị thấp nghi ngờ.

Sau đó so sánh giá trị T tính d-ợc với giá trị Tchuẩn (số phép đo: N) trong bảng 4.2

ở mức ý nghĩa 5% và 1%:

Nếu Ttính>Tchu ẩn thì xL và xH là sai số thô cần loại bỏ ở mức ý nghĩa thống kê đã cho.

Bảng 4.2: Giá trị T chuẩn ở 5% và 1 % của số không phù hợp với giá trị bất th-ờng trong mẫu chuẩn.

Số phép đo (N) Giá trị chuẩn Số phép đo (N) Giá trị chuẩn

5% 1% 5% 1% 3 1,15 1,15 15 2,41 2,71 4 1,46 1,49 16 2,44 2,75 5 1,67 1,75 18 2,50 2,82 6 1,82 1,94 20 2,56 2,88 7 1,94 2,10 30 2,74 3,10 8 2,03 2,22 40 2,87 3,24 9 2,11 2,32 50 2,96 3,34 10 2,18 2,41 60 3,03 3,41 12 2,29 2,55 100 3,21 3,60 14 2,37 2,66 120 3,27 3,66

Ngoài ra, các giá trị bất th-ờng có thể đ-ợc nhận biết bằng cách dùng đồ thị boxplot trong phần mềm thống kê MINITAB.

Một phần của tài liệu Giao trinh thong ke (Trang 28 - 30)

Tải bản đầy đủ (PDF)

(93 trang)