2 Các phân phối xác suất
3.1 Kiểm định dạng phân phối
3.1.2 Kiểm định Chi-square goodness-of-fit
Lý thuyết chung
Chi-square goodness-of-fit kiểm tra độ phù hợp của bộ dữ liệu với mơ hình, ví dụ kiểm tra đặc tính của bộ dữ liệu như bộ dữ liệu có thể chia thành các nhóm mà số lượng đữ liệu mỗi nhóm có thể coi như nhau hay khơng (đặc điểm dữ liệu trong các nhóm tương tự nhau). Thiết lập biểu thức: χ2 = n ∑ i=1 (Oi−Ei)2 Ei , Ei= (F(Yu)−F(Yl)).N
với:Oi số lượng dữ liệu trong nhómi,Ei là số dự liệu kỳ vọng cho nhómi,F là hàm phân phối của bộ dữ liệu,Yu,Yl lần lượt là cận trên và cận dưới giá trị của điểm dữ liệu trong nhómi,N là kích thước mẫu.
Giá trị χ2 đó sẽ được so sánh với giá trị phân phối khi bình phương với mức ý nghĩa xác định (trong Matlab cài đặt mặc định là5%và số bậc tự do làn−1, vớinlà số nhóm chia ra từ bộ dữ liệu).
Cài đặt Code
1. h = chi2gof(x)với x là bộ dữ liệu, câu lệnh trên sẽ trả về h=0nếu bộ dữ liệu có thể chia thành các phần bằng nhau theo kiểm định Chi-square goodness-of-fit với mức ý nghĩa 5%, ngược lạih=1.
2. h = chi2gof(x,Name,Value) thay đổi các tham số Name, Value để kiểm định bộ dữ liệu theo phân phối khác ngồi phân phối khi bình phương, thay đổi mức ý nghĩaα.
3. [h,p] = chi2gof(x)trả lại thêm giá trị p−valuecủa kiểm định.
Ví dụ minh họa
pd = makedist(’Normal’);
rng default; % for reproducibility
x = random(pd,50,1);
3 KIỂM ĐỊNH GIẢ THUYẾT
Kết quả trả vềh=0,p=0.319nên bộ dữ liệu có thể chia thành các phần bằng nhau có các đặc tính tương tự nhau.