Các ma trận hiệp phương sai(The covariance matrix)- 123docz.net

1 .Định nghĩa

4. Các ứng dụng của PCA

2.6. Các bước để phân tích thành phần chính

2.6.1.5 Các ma trận hiệp phương sai(The covariance matrix)

Nhớ lại hiệp phương sai mà luôn được đo giữa 2 chiều. Nếu chúng ta có một tập hợp dữ liệu với hơn 2 chiều, có nhiều hơn một phương sai đo lường có thể được tính tốn. Ví dụ, từ một tập hợp dữ liệu 3 chiều (chiều x, y, z), bạn có thể tính tốn cov (x, y), cov (x, z) và cov (y, z). Trong thực tế, đối với tập dữ liệu n-chiều, bạn có thể tính tốn tập hợp dữ liệu chiều, bạn có thể tính tốn.

Một cách hữu ích để có được tất cả các giá trị phương sai có thể có giữa tất cả các kích thước khác nhau để tính tốn tất cả chúng và đặt chúng trong một ma trận. Ta giả định trong hướng dẫn này mà bạn đã quen thuộc với các ma trận, và làm thế nào họ có thể được xác định. Vì vậy, định nghĩa cho các ma trận hiệp phương sai cho một tập hợp các dữ liệu có kích thước n là:

n hàng và n cột, và là x chiều. Tất cả những cơng thức này nhìn xấu xí nói là nếu bạn có một bộ dữ liệu n- chiều, sau đó các ma trận có n hàng và cột (như vậy là hình vng) và mỗi mục trong ma trận là kết quả của việc tính tốn phương sai giữa hai chiều riêng biệt. Ví dụ như các mục trên hàng 2, cột 3, là giá trị phương sai tính tốn giữa các chiều thứ 2 và chiều thứ 3.

Một ví dụ. Chúng ta sẽ tạo nên các ma trận hiệp phương sai cho một ảo 3 chiều bộ dữ liệu, sử dụng các kích thước thơng thường x, y và z.Then, ma trận hiệp phương sai có 3 hàng và 3 cột, và các giá trị này:

Một số điểm cần lưu ý: Xuống đường chéo chính, bạn sẽ thấy rằng các giá trị phương sai là giữa một trong các kích thước và chính nó. Đây là phương sai cho khơng gian đó. Điểm khác là kể từ khi cov (a, b) = cov (b, a), ma trận đối xứng về đường chéo chính.