Biểu diễn mối quan hệ của các biến khi quay trục

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu mức độ và phần đóng góp của các dạng nguồn thải chính tới nồng độ bụi nano trong không khí (Trang 26 - 27)

Phân tích thành phần chính (PCA)

Dạng phổ biến nhất của phân tích nhân tố và phân tích thành phần chính. Phương pháp này thường rất sẵn có trong các gói phân tích thống kê. Kết quả của

PCA thường được tính tốn bằng cách sử dụng phân tích vecto riêng của ma trận tương quan. Tuy nhiên, có một số vấn đề khi sử dụng phương pháp này. Mơ hình PCA dựa trên chuỗi n mẫu trong đó có m thơng số được phân tích. Vì vậy, phương trình (1.2) được viết lại dưới dạng ma trận như sau :

X = GF + E (1.13) Ma trận X có thể được viết dưới dạng sau theo phương pháp phân tích giá trị riêng SVD (singular value decompostion):

𝑋 = 𝑈𝑆𝑉′ = 𝑈̅𝑆̅𝑉′̅ + 𝐸 (1.14) Trong đó, 𝑈̅ và 𝑉̅ là các cột đầu tiên của ma trận U và V. Ma trận U và V là

các ma trận trực giao, được tính tốn từ phương pháp phân tích vectơ riêng, vectơ giá trị của ma trận XX’ và X’X. Vấn đề ở đây là phải tối thiểu E trong vế phải của phương trình (8). Phương pháp bình phương tối thiểu có thể giúp ta thực hiện được bài tốn đó.

𝑄 = ∑ ∑2

𝑒𝑖𝑗 = ∑ ∑(𝑥𝑖𝑗− ∑ 𝑓𝑖𝑘𝑔𝑘𝑗) ∑(𝑥𝑖𝑗 − ∑ 𝑓𝑖𝑗𝑔𝑖𝑗)2 (1.15) Vấn đề có thể được giải quyết, tuy nhiên nó khơng cho ra duy nhất một kết quả. Bởi khi quay trục, ta có thể tìm ta được nhiều mối quan hệ giữa các biến. Ma trận trên có thể được viết dưới dạng:

X = GTT-1F (1.16) Trong đó: T là ma trận chuyển. Sự chuyển đổi được gọi là phép quay để tìm ra các giá trị gần đúng với thực tế. Nếu khơng có thêm thơng tin, sẽ có rất nhiều ma trận T thỏa mãn. Để làm rõ vấn đề này, chúng ta có thể xem xét ví dụ về hai ngun tố sau, Fe và Si, được thể hiện trong hình 1.9 sau [44].

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu mức độ và phần đóng góp của các dạng nguồn thải chính tới nồng độ bụi nano trong không khí (Trang 26 - 27)

Tải bản đầy đủ (PDF)

(187 trang)