Các ứng dụng phân tích thành phần chính (Applications of principal

Một phần của tài liệu TIỂU LUẬN môn PHƯƠNG PHÁP TÍNH đề tài PHÂN TÍCH THÀNH PHẦN CHÍNH và ỨNG DỤNG (Trang 53 - 56)

1 .Định nghĩa

4. Các ứng dụng của PCA

2.8 Các ứng dụng phân tích thành phần chính (Applications of principal

component analysis )

✓ Overview (plots) of any data table (tổng quan về bản dữ liệu)

✓ Dimensionality reduction (giảm biến đa chiều)

✓ Similarity models( mơ hình tương đồng)

PCA có thể được áp dụng cho bất kỳ dữ liệu ma trận. Nó cũng được giới thiệu như là một bước khởi đầu của bất kỳ phép phân tích đa biến nào đề có được cái nhìn đầu tiên về cấu trúc dữ liệu, để xác định bên ngoài, phác họa các loại,.. Tuy nhiên, khi mục tiêu phân loại hoặc có liên quan một tập hợp các biến số khác( vd: hiệu chuẩn (calibration)), có phần mở rộng của PCA thì hiệu quả hơn cho những vấn đề này. Dưới đây là một quan điểm khá đảng phái (partisan) của PCA được trình bày. Nó phản ánh những kinh nghiệm mà rojections cũng coi bao gồm một phạm vi lớn đáng ngạc nhiên của các công thức vấn đề khoa học tiêu biểu.

2.8.1 Tổng quan về bản dữ liệu (Overview (plots) of any data table )

Lô điểm của hai hoặc ba vectơ điểm đầu tiên, t alpha cho thấy nhóm, giá trị ngoại lai và các mẫu mạnh khác trong dữ liệu. Điều này có thể được nhìn thấy trong các âm mưu của các điểm dữ liệu người Thụy Điển. Nhiều ứng dụng khác có thể được tìm thấy trong vấn đề này.

2.8.2 Giảm biến đa chiều (Dimensionality reduction)

Như đã chỉ ra bởi Frank và Kowalski, hai nhóm chính của ứng dụng PCA và FA có thể được nhìn thấy trong hóa phân tích (analytical chemistry), được đặt tên theo việc khai thác các yếu tố cơ bản – giá trị tiềm ẩn (the lantent varia) – bles - và độ phân giải quang phổ của hỗn hợp đa thành phần (multicomponent mixtures.) Trong hiệu suất cao phân tích sắc ký lỏng hai chiều(high performance liquid chromatographic analysis), tóm lại đây là một cách để tìm số nhỏ nhất của các loại trong một mẫu

Vài vectơ điểm đầu tiên, t alpha, có thể được xem như là các biến tiềm ẩn mà hiện hầu hết các thông tin trong dữ liệu. Điều này gần đây đã được sử dụng để tìm ra đặc tính chính của các amino acids, dung mơi và chất xúc tác, sau đó được sử dụng trong sự mơ tả định lượng của các lựa chọn của các thực thể. Ví dụ

Lơ của vectơ điểm PC đầu tiên và thứ hai của một bảng với 20 thuộc tính cho 20 amino acids thơng thường "tự nhiên". Nhóm chỉ ra một mối quan hệ giữa các thuộc tính lý hóa của các axit amin và nucleotide mà được sử dụng trong các codon thứ hai trong tổng hợp acid amin ((adenosine, uracil và cytosine). các axit amin

được mã hóa do guanine (G) dường như không tham gia vào mối quan hệ này những vec tơ điểm PC số lượng mô tả sự thay đổi cơ cấu trong các gia đình của các peptide và do đó tạo thành một cơ sở cho cấu trúc mối quan hệ hoạt động cho các peptide.

2.8.3 Mơ hình tương đồng (Similarity models )

Wold cho thấy một mơ hình máy tính có cùng một tài sản xấp xỉ cho một bảng dữ liệu của cùng một tài sản xấp xỉ cho một bảng dữ liệu của dữ liệu trong một khoảng thời gian hạn chế; các mơ hình máy tính có thể được xem như là một sự mở rộng của bảng dữ liệu Taylor. Các địa điểm gần giống nhau giữa các đối tượng, các điều khoản ít hơn là cần thiết trong việc mở rộng để đạt được một sự tốt lành xấp xỉ nhất định. các điều kiện tiên quyết cho cách giải thích này của PCA là một vài giả thuyết về sự khác nhau và liên tục của quá trình tạo dữ liệu, đã được tìm thấy để giữ trong nhiều trường hợp. Điều này giải thích, ít nhất là một phần, các tiện ích thiết thực của PCA.

Do đó, một phương pháp nhận dạng mẫu có thể dựa trên các mơ hình máy tính riêng biệt, một cho từng loại đối tượng. Các đối tượng mới được phân loại theo để phù hợp của họ hoặc thiếu phù hợp với mơ hình lớp học, trong đó cung cấp một phân loại theo xác suất. Đây là cơ sở cho các phương pháp Simca (Soft Independent Modelng của Class Analogies) Nếu muốn phân biệt một cách tối ưu giữa hai lớp của Thụy Điển, một mơ hình máy tính có thể được trang bị cho mỗi lớp. Kết quả cho thấy rằng thực sự có sự giống nhau trong lớp học (mơ hình hai hoặc ba thành phần mô tả đầy đủ các dữ liệu) và các lớp học được tách tốt (mẫu mới phù hợp với những "lớp lưu trữ" xấu và ngược lại);

Một phần của tài liệu TIỂU LUẬN môn PHƯƠNG PHÁP TÍNH đề tài PHÂN TÍCH THÀNH PHẦN CHÍNH và ỨNG DỤNG (Trang 53 - 56)