MANOVA ANOVA đa biến

Một phần của tài liệu Machine Learning Toolbox trong MatLab (Trang 102 - 106)

5 ANOVA

5.2 MANOVA ANOVA đa biến

Giới thiệuANOVA làm việc với 1 biến phụ thuộc. Nhưng thường thì có nhiều biến phụ thuộc, và chúng ta muốn xác định xem một tập hợp các giá trị trung bình có khác so với group tiếp theo hay khơng. Khi đó chúng ta cần đến MANOVA.Cài đặt code

1. d = manova1(X,group)thực hiện MANOVA 1 chiều để so sánh trung bình đa biến của các cột của X, nhóm theo group. Dữ liệuX là ma trận cỡ mxn, và mỗi hàng là 1 vector đo

lường trênnbiến cho mỗi lần quan sát. Hai quan sát thuộc cùng 1 goup nếu chúng có cùng giá trị trong mảnggroup. Các quan sát trong mỗi nhóm đại diện cho 1 mẫu từ tổng thể.

Hàm trên trả vềd, một ước lượng kích thước khơng gian chứa các giá trị trung bình của

cácgroup.manova1kiểm định giả thuyết rằng trung bình của các group cùng là 1 vector đa biếnnchiều, và bất cứ sự khác biệt nào quan sát được trongX đều là do ngẫu nhiên. Nếud=0thì khơng thể bác bỏ giả thuyết đó, nếud =1thì có thể bác bỏ giả thuyết với

5 ANOVA

xác suất sai lầm 5%. Tương tự, nếud =2thì trung bình đa biến có thể nằm trên cùng một mặt phẳng trong không giannchiều, nhưng không cùng nằm trên một đường thẳng. 2. [d,p] = manova1(...)trả thêm plà vector của các p-value kiểm định xem các trung bình

có nằm rong các khơng gian 0 hay 1 chiều hay không. Số chiều lớn nhất có thể được có thể là số chiều của khơng gian hoặc số group trừ đi 1.

3. [d,p,stats] = manova1(...)trả ra thêmstats, một cấu trúc chứa các kết quả bổ sung của

MANOVA VD: Dữ liệucarsmall đo trên nhiều mẫu xe ô tô khác nhau từ năm 1970, 1976 và 1982. Giả sử bạn quan tâm đến việc liệu các đặc điểm của ơ tơ có thay đổi theo thời gian hay khơng.

>> load carsmall >> whos

Name Size Bytes Class Attributes

Acceleration 100x1 800 double Cylinders 100x1 800 double Displacement 100x1 800 double Horsepower 100x1 800 double MPG 100x1 800 double Mfg 100x13 2600 char Model 100x33 6600 char Model_Year 100x1 800 double Origin 100x7 1400 char Weight 100x1 800 double

Bốn biến trong số này (Acceleration, Displacement, Horsepowervà MPG) là các phép đo

liên tục trên các mẫu xe riêng lẻ. BiếnModel_year là năm chiếc xe được sản xuất. Tạo một ma trận đồ thị nhóm của các biến này bằng cách sử dụng hàmgplotmatrix:

>> x = [MPG Horsepower Displacement Weight]; >> gplotmatrix(x,[],Model_Year,[],’+xo’)

5 ANOVA

Có vẻ như những chiếc xe có sự khác nhau giữa các năm. Ví dụ, biểu đồ phía trên bên phải là biểu đồMPG-Weight. Những chiếc xe năm 1982 có quãng đường đi được cao hơn

những năm trước và khối lượng xe nhìn chung là ít hơn. Nhưng cùng 1 group, 3 năm này có khác nhau đáng kể khơng? Hàmmanovasẽ kiểm chứng điều đó:

>> [d,p,stats] = manova1(x,Model_Year) d = 2 p = 10-6 x 0.0000 0.1141

stats = struct with fields: W: [4x4 double] B: [4x4 double] T: [4x4 double] dfW: 90

5 ANOVA dfT: 92 lambda: [2x1 double] chisq: [2x1 double] chisqdf: [2x1 double] eigenval: [4x1 double] eigenvec: [4x4 double] canon: [100x4 double] mdist: [2.8187 0.7899 0.6187 0.4050 0.8538 4.2337 6.0117 4.9600 ... ] gmdist: [3x3 double] gnames: {3x1 cell}

Một phần của tài liệu Machine Learning Toolbox trong MatLab (Trang 102 - 106)

Tải bản đầy đủ (PDF)

(184 trang)