IV. ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU
2.2.2 Trƣờng hợp nhiều hơn hai tổng thể
Trong trƣờng hợp nhiều hơn hai tổng thể ( ), giả sử ma trận hiệp phƣơng sai của các tổng thể bằng nhau: ∑ ∑ ∑ ∑. Gọi
là véctơ trung bình của các tổng thể theo biến I,
̅ ∑ là véctơ trung bình chung của các tổng thể theo biến x. Đặt , khi đó
là trung bình của theo biến y,
̅ ∑ ̅ là véctơ trung bình chung của các tổng thể theo biến y,
∑ là phƣơng sai giống nhau của các tổng thể theo biến y.
Tƣơng tự nhƣ trƣờng hợp hai tổng thể, để tìm hàm phân biệt tuyến tính y, chúng ta tìm để biểu thức sau đạt giá trị lớn nhất
∑( ̅ ) ∑ [∑ ( ̅)( ̅) ] ∑ ∑ ( ) ∑( ̅)( ̅)
Gọi với ( ) là giá trị riêng khác 0 của ma trận ∑ .
Với giá trị riêng , Fisher chứng minh rằng biểu thức (2.1) đạt giá trị lớn nhất khi véctơ thỏa ,(∑ )
∑
Khi đó đƣợc gọi là hàm phân biệt thứ i.
Giả sử có hàm phân biệt Fisher vừa tìm ở trên thì khoảng cách từ
21
( ) ( ) ( ) ∑ . /
∑, ( )-
Việc phân loại phần tử mới có giá trị y theo phƣơng pháp Fisher đƣợc
thực hiện rất tự nhiên.
Xếp phần tử mới vào tổng thể nếu bình phƣơng khoảng cách từ ytới
nhỏ hơn bình phƣơng khoảng cách từ y tới với mọi
Cụ thể
Xếp y vào tổng thể ( ) ( )
Gọi x là biến quan sát của phần tử mới sao cho , ta có
( ) ∑[ ( )] ( ) ∑ ( ) ( ) ∑ Trong đó ( ) ∑ ∑
Lúc này phần tử mới sẽ đƣợc xếp vào nếu ( ) nhỏ nhất. Vì
∑ giống nhau cho tất cả ( ) nên quy tắc phân loại đơn giản nhƣ sau:
Xếp phần tử mới vào nếu ( ) * ( )+