Use of Principal Components for Description

Một phần của tài liệu tiểu luận xử lý ảnh nâng cao trình diễn và mô tả hình ảnh (Trang 28 - 37)

Các tài liệu được thảo luận trong phần này áp dụng đối với đường bao và phân vùng. Ngoài ra, có cũng có thể được sử dụng làm cơ sở cho việc mô tả bộ hình ảnh được phân tập trong không gian, nhưng có những pixel tương ứng giá trị khác nhau (ví dụ, hình ảnh thành phần của một hình ảnh màu RGB). Giả sử ta có được những hình ảnh thành phần của một hình ảnh màu sắc. Ba hình ảnh có thể được xử lý như một đơn vị, bằng cách thể hiện từng nhóm ba điểm ảnh tương ứng như một vector. Ví dụ, x1, x2, x3 là giá trị của

các điểm ảnh đầu tiên trong ba hình ảnh. Ba phần tử này có thể được thể hiện dưới dạng của một vector cột 3-D.

Vector này đại diện cho một điểm ảnh chung trong tất cả ba hình ảnh trên. Nếu những hình ảnh có kích thước M x N, sẽ có tổng cộng K = MN vector 3-D sau khi tất cả các điểm ảnh được thể hiện theo cách này. Nếu ta có hình ảnh n-mức, các vectơ sẽ là n chiều:

Bảng 11.3: Giá trị moment bất biến của các hình ảnh trong hình 11.19

Trong suốt phần này, giả định là tất cả các vectơ là vectơ cột (ma trận n x 1). Ta có thể viết chúng trên một dòng đơn giản bằng cách chuyển vị ma trận như đã học.

Chúng ta có thể xử lý các vectơ như số lượng ngẫu nhiên, giống như ta đã làm khi xây dựng một biểu đồ màu xám histogram. Sự khác biệt duy nhất là, thay vì nói về số lượng như giá trị trung bình và phương sai của biến ngẫu nhiên, bây giờ chúng ta nói về vector trung bình và ma trận liên hiệp của các vectơ ngẫu nhiên. Vector trung bình được định nghĩa là:

trong đó E {•} là giá trị kỳ vọng của các đối số, và chỉ số biểu thị rằng m có liên quan đến vectơ x. Nhớ lại rằng giá trị kỳ vọng của một vector hoặc ma trận thu được bằng cách lấy giá trị kỳ vọng của từng yếu tố.

Ma trận liên hiệp của vector tập hợp được định nghĩa là:

Bởi vì x là một ma trận n chiều, Cx là ma trận ( nxn ). Các phần tử Cij của Cx là phương sai của x, phần tử thứ i của vector x là 1 tập hợp, và phần tử Cij là liên hiệp giữa các phần tử xi và xj của những vector đó. Ma trận Cx là thực và đối xứng. Nếu các phần tử xi và xj của nó không tương quan, thì ma trận hiệp biến bằng 0, nên Cij = Cji = 0.

Đối với vector mẫu K từ một tập hợp ngẫu nhiên, vector trung bình có thể xấp xỉ từ các mẫu bằng cách sử dụng các cách tính trung bình quen thuộc.

Tương tự, ta sử dụng công thức (11.4-2), ta có thể xác định ma trận hiệp biến, nó được xấp xỉ từ những mẫu như dưới đây:

Để minh họa cho công thức (13.4-4) và (11.4-5), hãy xem xét bốn vectơ x1 = (0,0, 0)’, x2 = (1,0 0.)’, x3 = (1,1,0)’, và x4 = (1,0,1)’, với sự hoán đổi được sử dụng để vector cột có thể được thuận tiện viết theo chiều ngang trên một dòng văn bản, như đã nói trước đây. Áp dụng phương trình (11.4-4) thu được các vector trung bình sau đây:

Tương tự, sử dụng công thức (11.4-5) ta thu được những ma trận hiệp biến sau đây:

Tất cả những phần tử nằm trên đường chéo chính đều bằng nhau, điều này cho thấy rằng cả 3 thành phần của vector tập hợp có cùng phương sai. Và những phần tử x1 và x2, x1 và x3, là tương quan dương. Trong khi đó, x2 và x3 là tương quan âm.

Bởi vì Cx là ma trận thực và đối xứng, việc tìm kiếm một bộ n vector trực giao riêng luôn luôn là có thể (Noble và Daniel [1988]). Cho ei và λi với i = 0,1,2,…n là vector riêng và trị riêng tương ứng của. Gọi A là một ma trận mà hàng được hình thành từ các vector riêng của Cx, hàng đầu tiên của A là vector riêng tương ứng với giá trị đặc trưng lớn nhất, và dòng cuối cùng là vector riêng tương ứng với giá trị đặc trưng nhỏ nhất.

Giả sử chúng ta sử dụng một ma trận chuyển đổi để lập bản đồ vetor x vào vector y, như sau:

Biến đổi này được gọi là biến đổi Hotelling, sẽ được tìm hiểu trong các mục sắp tới, và có một số tính chất thú vị và hữu ích.

Không khó để có thể chỉ ra răng giá trị trung bình của vector y sau khi bị dịch chuyển là bằng 0, đó là:

Từ lý thuyết ma trận cơ bản mà các ma trận hiệp phương sai của y được đưa ra trong các mối liên hệ của A và Cy qua sự biểu hiện:

Hơn nữa, vì cách ma trận A được thành lập, Cy là một ma trận mà các thành phần dọc theo đường chéo chính là những giá trị riêng của Cx, đó là:

Các thành phần ngoài đường chéo của ma trận hiệp biến này là 0, do đó các phần tử của các vectơ y được không tương quan với nhau. Hãy nhớ rằng λi là những giá trị riêng của C, và các phần tử dọc theo đường chéo chính của một ma trận đường chéo là giá trị riêng

của nó (Noble và Daniel [1988]). Do đó Cx và Cy có giá trị riêng tương tự. Trong thực tế, điều này cũng đúng cho các vector riêng.

Một đặc tính quan trọng của biến đổi Hotelling đối với việc cấu trúc lại x từ y. Bởi vì các hàng của A là vectơ trực giao, hay A^(-1) = A’, và bất kỳ vector x có thể được cấu trúc lại từ y tương ứng của nó, bằng cách sử dụng các phương pháp:

Giả sử, thay vì sử dụng tất cả các vector riêng của Cx, chúng ta hình thành ma trận Ak từ vector riêng k tương ứng với k giá trị riêng lớn nhất, cho ra một ma trận chuyển đổi bậc (k x n). Các vectơ y sau đó sẽ là vector k chiều, và việc cấu trúc lại được đưa ra trong phương trình (11.4-10) sẽ không còn là chính xác (điều này tương tự như phương pháp ta sử dụng trong mục 11.2.3 để mô tả một đường bao với một vài hệ số Fourier).

Vector tái cấu trúc bằng cách sử dụng Ak:

Nó có thể được xem như là sai số bình phương trung bình giữa x và y, được cho bởi biểu thức sau:

Dòng đầu tiên của phương trình (11.4-12) chỉ ra rằng lỗi là bằng không nếu k = n (có nghĩa là, nếu tất cả các vector riêng được sử dụng trong việc chuyển đổi). Vì Ay giảm đơn điệu, phương trình (11.4-12) cũng cho thấy rằng lỗi này có thể được giảm thiểu bằng cách chọn các vector riêng k liên quan đến các giá trị riêng lớn nhất. Do đó, biến đổi Hotelling là tối ưu, trong ý nghĩa là nó giảm thiểu các sai số bình phương trung bình giữa các vectơ x và xấp xỉ của x. Do ý tưởng này bằng cách sử dụng vector riêng tương ứng đến các giá trị riêng lớn nhất, biến đổi Hotelling cũng được gọi là thành phần chủ yếu chuyển đổi.

Hình 11.20: Sáu ảnh phổ được lấy từ máy quét trên không

Hàng đầu tiên của A là vector riêng tương ứng với giá trị đặc trưng lớn nhất của ma trận hiệp biến của tập hợp, và giá trị đặc trưng này cung cấp cho các phương sai của các cấp độ màu xám của hình ảnh được chuyển đổi đầu tiên. Vì vậy, dựa trên những con số thể hiện trong Bảng 11.5, hình ảnh này phải có độ tương phản cao nhất, đây là trường hợp khá rõ ràng trong hình 11.21. Bởi vì hai hình ảnh đầu tiên chiếm khoảng 94% tổng phương sai, thực tế là bốn hình ảnh thành phần chính khác có độ tương phản thấp không phải là bất ngờ. Vì vậy, nếu thay vì lưu trữ tất cả sáu hình ảnh cho việc xử lý về sau, chỉ có hai hình ảnh chuyển đổi đầu tiên, cùng với mx và hai hàng đầu tiên của A được lưu trữ, từ đó ta có thể xây dựng lại một xấp xỉ với sáu hình ảnh ban đầu một cách tin cậy. Khả năng này dùng để thực hiện nén dữ liệu, mặc dù không ấn tượng bởi tiêu chuẩn hiện nay là sử dụng biến đổi Hotelling. Về mô tả, điều này có nghĩa là mô tả nội dung của sáu hình ảnh từ hai hình, cộng với vector trung bình và hai hàng đầu tiên của ma trận chuyển đổi. Lập luận tương tự sẽ được áp dụng nếu thay vì toàn bộ hình ảnh ta đã thảo luận về phân vùng.

Bảng 11.5: Giá trị đặc trưng của ma trân hiệp biến thu được từ hình 11.21

Ví dụ 11.11:

Sử dụng các thành phần chủ yếu để mô tả đường bao và phân vùng trong một hình ảnh duy nhất.

Trong các vấn đề được thảo luận trước đó, ta đã cho thấy làm thế nào để áp dụng thay đổi các phần tử chủ yếu của toàn bộ hình ảnh hoặc phân vùng. Trong ví dụ này ta minh họa cách sử dụng thành phần chủ yếu để mô tả đường bao và phân vùng trong một hình ảnh duy nhất. Cách tiếp cận này hình thành các vector hai chiều từ các tọa độ đường bao hoặc phân vùng. Xem xét các đối tượng trong hình 11.22a. Vector được hình thành từ các tọa độ của các điểm ảnh trong các đối tượng nếu chúng ta muốn mô tả khu vực. Nếu chúng ta muốn mô tả đường bao, ta chỉ sử dụng các tọa độ của các điểm trên đường bao.

Các vectơ có được sau đó được coi là một tập hợp 2-D của các vectơ ngẫu nhiên. Nói cách khác , mỗi điểm ảnh trong các đối tượng được coi là một vector 2-D x = (a, b)’, trong đó a và b là các giá trị tọa độ của điểm ảnh đó đối với trục x1 và x2. Đây là những vectơ được sử dụng để tính toán vector trung bình và ma trận hiệp phương sai của đối tượng. Vấn đề này đơn giản hơn nhiều so với trước đây bởi vì ta đang làm việc trong môi trường 2 chiều.

Ảnh hưởng thực của việc sử dụng phương trình (11.4-6) là thiết lập một hệ thống phối hợp mới có nguồn gốc là trọng tâm của đối tượng (tọa độ của vector trung bình ) và có trục là các vector riêng của Cv, như thể hiện trong hình 11.22b. Hệ thống tọa độ này cho thấy rõ ràng rằng sự thay đổi trong phương trình (11.4-6 ) là một biến đổi xoay và gắn dữ liệu vào các vector riêng.

Hình 11.22: (a) Đối tượng (b) Giá trị riêng (c) Xoay đối tượng dùng công thức 11.4-6 Các khái niệm về việc sắp xếp một đối tượng 2-D với vector riêng chính của nó đóng một vai trò quan trọng trong công việc mô tả. Như đã đề cập trước đó, mô tả cần phải độc lập với các biến đổi về kích thước, dịch chuyển và khả năng xoay. Để sắp xếp các đối tượng với trục chính của nó, cung cấp một phương pháp đáng tin cậy để loại bỏ những ảnh hưởng của sự dịch chuyển. Giá trị riêng là phương sai dọc theo trục chính, và có thể được sử dụng cho kích thước bình thường. Những ảnh hưởng của dịch chuyển được xử lý bằng cách tập trung các đối tượng về ý nghĩa của nó, như trong phương trình (11.4-6). Hãy nhớ một thực tế rằng các phương pháp mô tả nguồn gốc trong phần này là tương đương nhau đối với cả phân vùng và đường bao.

Một phần của tài liệu tiểu luận xử lý ảnh nâng cao trình diễn và mô tả hình ảnh (Trang 28 - 37)

Tải bản đầy đủ (DOCX)

(46 trang)
w