Mục tiêu của PCA

Một phần của tài liệu TIỂU LUẬN môn PHƯƠNG PHÁP TÍNH đề tài PHÂN TÍCH THÀNH PHẦN CHÍNH và ỨNG DỤNG (Trang 27 - 29)

1 .Định nghĩa

4. Các ứng dụng của PCA

2.3 Mục tiêu của PCA

Mục tiêu của PCA là tìm một khơng gian mới (với số chiều nhỏ hơn không gian cũ). Các trục tọa độ trong không gian mới được xây dựng sao cho trên mỗi trục, độ biến thiên của dữ liệu trên đó là lớn nhất có thể. Tiếng Việt thì dài dịng, nhưng tiếng Anh thì mục tiêu này gọi là maximize the variability. Ba chữ này gói gọn ý tưởng chính của PCA.

Minh họa PCA: phép chiếu lên các trục tọa độ khác nhau có thể cho cách nhìn rất khác nhau về cùng một dữ liệu.

Một ví dụ kinh điển là hình ảnh về con lạc đà. Cùng là một con lạc đà nhưng nếu nhìn từ bên hơng thì ta có được đầy đủ thơng tin nhất, trong khi nhìn từ phía trước thì thật khó để nói nó là lạc đà.

Một ví dụ thuyết phục hơn được minh họa trong hình sau

Minh họa PCA: tìm các trục tọa độ mới sao cho dữ liệu có độ biến thiên cao nhất

Giả sử tập dữ liệu ban đầu (tập điểm màu xanh) được quan sát trong không gian 3 chiều (trục màu đen) như hình bên trái. Rõ ràng 3 trục này không biểu diễn được tốt

nhất mức độ biến thiên của dữ liệu. PCA do đó sẽ tìm hệ trục tọa độ mới (là hệ trục màu đỏ trong hình bên trái). Sau khi tìm được khơng gian mới, dữ liệu sẽ được chuyển sang khơng gian này để được biểu diễn như trong hình bên phải. Rõ ràng hình bên phải chỉ cần 2 trục tọa độ nhưng biểu diễn tốt hơn độ biến thiên của dữ liệu so với hệ trục 3 chiều ban đầu.

Một điểm rất đẹp nữa của PCA là các trục tọa độ trong không gian mới luôn đảm bảo trực giao đôi một với nhau, mặc dù trong khơng gian ban đầu, các trục có thể khơng trực giao.

Một phần của tài liệu TIỂU LUẬN môn PHƯƠNG PHÁP TÍNH đề tài PHÂN TÍCH THÀNH PHẦN CHÍNH và ỨNG DỤNG (Trang 27 - 29)