Phân tích phương sa i1 chiều

Một phần của tài liệu Machine Learning Toolbox trong MatLab (Trang 94 - 96)

5 ANOVA

5.1.1 Phân tích phương sa i1 chiều

Lý thuyết chung

ANOVA 1 chiều kiểm tra xem các group (level) của factor có cùng trung bình hay khơng, qua đó cho biết rằng các group khác nhau của 1 biến độc lập có ảnh hưởng gì đến biến phụ thuộcyhay khơng. Ví dụ như, 1 bệnh viện muốn xác định xem xem liệu 2 phương pháp lập lịch mới được đề xuất có giúp giảm thời gian chờ của bệnh nhân so với phương pháp cũ hay khơng. Trong ví dụ trên, biến độc lập là cách lập lịch, còn biến phụ thuộc là thời gian chờ của bênh nhân.

ANOVA 1 chiều là trường hợp đơn giản của mơ hình tuyến tính có dạng:

yi j=αj+εi j

Trong đó:

yi j là một mẫu quan sát, vớiilà chỉ số của mẫu, jlà chỉ số group của mẫuyi. Và tất cảyi j độc lập với nhau.

αj là trung bình của group j.

εi j là sai số ngẫu nhiên tuân theo phân phối chuẩn (0,σ2) vớiσ là hằng số.

ANOVA kiểm định giả thuyết "Mọi group có trung bình bằng nhau" (H0:α1 =α2 =...=

αk) và đối thuyết "Có ít nhất 1 group có trung bình khác với group khác nó" (H1 :∃1⩽a,b⩽

k,αa ̸=αb).

Cài đặt code

1. p = anova1(y)biểu diễn ANOVA một chiều cho mẫu dữ liệuyvà trả về p-value.anova1

5 ANOVA

trung bình giống nhau. Hàm trên cịn vẽ đồ thị boxplot cho từng nhóm trongy và bảng ANOVA chuẩn.

2. p = anova1(y), group biểu diễn ANOVA 1 chiều của y, các group được xét theo group

trong hàm.

3. p = anova1(y, group, displayopt): Nếu giá trị displayopt là ’on’ sẽ hiển thị boxplot và bảng ANOVA, nếu là ’off’ thì ngược lại.

4. [p, tbl] = anova1(___)trả ra bảng ANOVA có chú thích hàng và cột dựa theo tên được ghi trong anova1(___)theo các bộ dữ liệu được đưa vào trước đó.

5. [p, tbl, stat] = anova1(___)trả ra cấu trúcstat để có thể thực hiên multiple comparison test, giúp chọn ra các cặp group nào có trung bình lệch nhau nhiều.

Ví dụ minh hoạ

Tạo ma trận dữ liệu mẫu ykích thước 5x5 với các cột đều là hằng số công với ma trận 5x5 các giá trị ngẫu nhiên của phân phối chuẩn (0, 1). Sau đó thực hiện hàmanova1(y):

>> y = meshgrid(1:5);

>> rng default; % For reproducibility

>> y = y + normrnd(0,1,5,5) y = 1.5377 0.6923 1.6501 3.7950 5.6715 2.8339 1.5664 6.0349 3.8759 3.7925 -1.2588 2.3426 3.7254 5.4897 5.7172 1.8622 5.5784 2.9369 5.4090 6.6302 1.3188 4.7694 3.7147 5.4172 5.4889 >> p = anova1(y) p = 0.0023 Ngồi ra cịn trả kèm về 2 ảnh:

5 ANOVA

Một phần của tài liệu Machine Learning Toolbox trong MatLab (Trang 94 - 96)

Tải bản đầy đủ (PDF)

(184 trang)