Xây dựng không gian thấp chiều

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu phương pháp tra cứu ảnh sử dụng phân cụm gia tăng với phản hồi liên quan (Trang 44 - 45)

Sau khi tính toán phương sai between-class (𝑆𝐵) và phương sai within-class (𝑆𝑊), ma trận biến đổi 𝑊 của kỹ thuật LDA có thể được tính như trong phương trình (7), được gọi là tiểu chuẩncủa Fisher. Công thức này có thể được phát biểu như trong phương trình (8).

argmax

𝑊

𝑊𝑇𝑆𝐵𝑊

𝑊𝑇𝑆𝑊𝑊 (7)

𝑆𝐵𝑊 = 𝜆𝑆𝑊𝑊 (8)

ở đây 𝜆 biểu diễn các giá trị riêng của ma trận biến đổi (𝑊). Nghiệm của bài toán này có thể thu được bởi tính toán các giá trị riêng 𝜆 = {𝜆1, 𝜆2, … 𝜆𝑀} và các véc tơ riêng 𝑉 = {𝑣1, 𝑣2, … 𝑣𝑀} của ma trận 𝑆𝑊−1𝑆𝐵, nếu 𝑆𝑊 khả nghịch.

Các giá trị riêng là các giá trị vô hướng, trong khi các véc tơ riêng là các véc tơ khác không, thỏa mãn phương trình (8) và cung cấp cho chúng ta thông tin về không gian LDA. Các véc tơ riêng biểu diễn các hướng của không gian mới , và các giá trị riêng tương ứng biểu diễn nhân tố tỉ lệ, độ dài hoặc độ lớn của các véc tơ riêng. Bởi vậy, mỗi véc tơ riêng biểu diễn một trục của không gian LDA, và giá trị riêng kết hợp biểu diễn độ mạnh của véc tơ riêng này. Độ mạng của véc tơ riêng phản ánh khả năng phân biệt giữa các lớp của nó, tức là tăng phương sai between-class, và giảm phương sai within-class của mỗi lớp; do đó đạt được mục tiêu LDA. Bởi vậy, các véc tơ riêng với k giá trị riêng lớn nhất được sử dụng để xây dựng một không gian thấp chiều (𝑉𝑘), trong khi các véc tơ riêng khác

({𝑣𝑘+1, 𝑣𝑘+2, . . 𝑣𝑀}) bị loại đi như được chỉ ra trong Hình 2.5 (Bước G). Hình 2.2 chỉ ra không gian chiều thấp hơn của kỹ thuật LDA, được tính toán như trong Hình 2.5 (Bước G). Như được chỉ ra, chiều của ma trận dữ liệu gốc (𝑋 ∈ 𝑅𝑁×𝑀) được giảm bằng việc chiếu nó lên không gian chiều thấp hơn của LDA (𝑉𝑘 ∈ 𝑅𝑁×𝑘) được chú thích trong phương trình (9). Chiều của dữ liệu sau khi chiếu là k; do đó, M-k đặc trưng bị bỏ qua hoặc xóa khỏi mỗi mẫu. Do đó, mỗi mẫu 𝑥𝑖 được biểu diễn bằng một điểm trong không gian M chiều sẽ được biểu

diễn trong một không gian k chiều bởi chiếu nó lên không gian chiều thấp hơn (𝑉𝑘) như sau, 𝑦𝑖 = 𝑉𝑘𝑥𝑖

𝑌 = 𝑋 𝑉𝑘 (9)

Để dự đoán một ảnh thuộc cụm nào, chúng ta tính ma trận hiệp phương sai gộp chung C, tính theo công thức:

𝐶(𝑟, 𝑠) = 1

𝑁∑𝑔𝑖=1𝑛𝑖𝑐(𝑖)(𝑟, 𝑠)

P là véc tơ xác suất tiền nghiệm 𝑃 = [𝑝1… , 𝑝𝑔] 𝑇 với 𝑝𝑖 biểu diễn xác suất tiền nghiệm của cụm i. Ở đây, do không biết xác suất tiền nghiệm nên chúng ta lấy bằng số phần tử trong mỗi cụm chia cho tổng số phẩn tử:

𝑝𝑖 = 𝑛𝑖

𝑁

Đối tượng 𝑥𝑘 được gán vào cụm 𝑖 nếu hàm 𝑓𝑖 đạt cực đại.

𝑓𝑖 = 𝜇(𝑖)𝐶−1𝑥𝑘𝑇 −1 2𝜇

(𝑖)𝐶−1𝜇𝑖𝑇 + ln(𝑝𝑖)

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu phương pháp tra cứu ảnh sử dụng phân cụm gia tăng với phản hồi liên quan (Trang 44 - 45)

Tải bản đầy đủ (PDF)

(62 trang)