CHƯƠNG 4 HIỆN THỰC CÁC KỸ THUẬT NÉN ẢNH
4.2. HIỆN THỰC KỸ THUẬT NÉN KHÔNG BẢO TOÀN
4.2.2. Phân tích thành phần chính (PCA)
Phân tích thành phần chính (PCA) đƣợc phát minh vào năm 1901 bởi Karl Pearson, sau đó, PCA đƣợc phát triển độc lập bởi Harold Hotelling trong những năm 1930. Trong lĩnh vực xử lý ảnh, PCA là kỹ thuật chuyển đổi các giá trị độ sáng của pixel và sự chuyển đổi này sẽ nén dữ liệu ảnh bằng cách giữ tối đa lƣợng thông tin hữu ích và loại bỏ các thông tin trùng lắp (các yếu tố tương quan). Kết quả là dữ liệu ảnh thu được (gọi là ảnh thành phần chính) chỉ chứa các kênh ảnh ít tương quan (độc lập tuyến tính) thường được sử dụng rất hiệu quả trong tổ hợp màu và phân loại ảnh. Phương pháp này được áp dụng trong viễn thám trên cơ sở một thực tế là ảnh chụp ở các kênh phổ gần nhau có độ tương quan rất cao, vì vậy thông tin của chúng có phần trùng lặp rất lớn (ảnh đa phổ chứa nhiễu cũng nhƣ dƣ thừa thông tin).
Trong thực tế, các ảnh viễn thám chụp ở các kênh phổ gần nhau có độ tương quan rất cao. Trường hợp ảnh vệ tinh Landsat, giữa các kênh 1, 2, 3 và giữa kênh 4 và 5 cho thông tin ảnh với lượng trùng lặp lớn. Những kênh có độ tương quan cao khi cùng đƣợc sử dụng để tổ hợp màu hay chiết tách các đối tƣợng có phản xạ phổ tương đồng sẽ gây dư thừa thông tin đối với đối tượng này và bỏ sót những đối tƣợng khác.
Khi đó, phân tích thành phần chính (PCA) đƣợc sử dụng. Khả năng ứng dụng của kĩ thuật PCA:
Ảnh viễn thám đa kênh phổ, những kênh là những biến. Số chiều của ảnh tương ứng với số kênh. Từ những kênh gốc có tương quan cao, để tiết kiệm không gian chứa dữ liệu và thời gian tính toán, các kênh có thể đƣợc kết hợp thành một kênh mới, ảnh riêng được tạo ra bởi kĩ thuật PCA có ít mối tương quan giữa các kênh. Theo đó, PCA có khả năng giữ lại những thành phần quan trọng nhất của dữ
Trang 49 liệu, đồng thời lọc bỏ nhiễu. Đây đƣợc xem là một công cụ để nén hình ảnh mà không làm mất thông tin.
Sử dụng PCA là một cách để xác định các mẫu trong dữ liệu, thể hiện các dữ liệu theo một cách nào đó để làm nổi bật sự tương đồng và khác biệt của chúng, sử dụng rất hiệu quả trong phân loại ảnh và xác định biến động.
Thuật toán PCA
Phân tích thành phần chính là một trường hợp đặt biệt của chuyển đổi dữ liệu gốc vào một hệ tọa độ mới. Nếu dữ liệu gốc bao gồm n biến khác nhau, mỗi quan sát có thể đƣợc xem nhƣ là một điểm trong không gian vector n chiều. Để dễ hiểu khả năng nén dữ liệu của PCA ta tìm hiểu khả năng làm giảm số chiều trong trường hợp dữ liệu gốc có 2 chiều.
(a) (b)
Hình 29. Xu hướng phân bố dữ liệu (a) và đường thể hiện PC1 và PC2 (b) Giá trị độ sáng của pixel thể hiện bởi X1, X2, mặc dù kết tụ xung quanh một số điểm trung tâm trong không gian, nhƣng nhìn chung giá trị độ sáng của pixel sẽ có xu hướng hướng tới một hướng nhất định (a). Nếu có thể vẽ một đường theo hướng chính đó thì đường đó sẽ trở thành thành phần chính đầu tiên của bộ dữ liệu 2 chiều (PC1). Trên dòng chính này, giá trị độ sáng từ dữ liệu 2 chiều cũ đƣợc phân bố lại. Tương tự ta vẽ được đường thể hiện thành phần chính thứ 2 (PC2) (b). Giữa hai thành phần chính này, PC1 giữ lƣợng lớn thông tin từ dữ liệu gốc, PC2 chỉ chứa khoảng 5% thông tin. Trong trường hợp nhất định, lượng thông tin trên PC2 có thể
Trang 50 đƣợc bỏ qua, và nhƣ vậy từ bộ dữ liệu gốc 2 chiều X1, X2 đƣợc đã đƣợc nén lại với sự bảo toàn thông tin tương đối trở thành dữ liệu mới một chiều PC1.
Đối với ảnh viễn thám, mỗi ảnh chứa nhiều kênh tương ứng với nhiều chiều.
Để giảm dung lƣợng của ảnh mà vẫn bảo toàn đƣợc lƣợng thông tin, ta phải loại bỏ phần thông tin trùng lắp. Tức là, biến đổi bộ ảnh gốc thành bộ dữ liệu ảnh mới với các kênh ảnh không có sự tương quan.
Để có được các kênh ảnh không tương quan, ta phải xác định vector riêng và trị riêng của ma trận hiệp phương sai của các kênh. Khi đó vector riêng và trị riêng để biểu thị các thành phần chính của các kênh. Mỗi vector riêng đại diện cho một thành phần chính. Thành phần chính đầu tiên đƣợc định nghĩa là vector riêng với trị riêng tương ứng cao nhất. Phương sai là độ phân tán dữ liệu, trong ảnh viễn thám, phương sai thể hiện khả năng chứa thông tin của kênh ảnh, phương sai càng lớn, kênh ảnh càng chứa nhiều thông tin. Các trị riêng riêng lẻ chỉ ra phương sai mà chúng nắm giữ, với trị riêng cao hơn tương ứng với phương sai lớn hơn.
Biến đổi thành phần chính bao gồm 3 bước (Eklundh và Singh, 1993):
Đầu tiên là tính ma trận hiệp phương sai trong bộ dữ liệu ảnh đầu vào.
Hai là tính toán trị riêng và vector riêng.
Ba là tính thành phần chính.
Thuật toán tính nhận bộ dữ liệu ảnh mới không tương quan Z=A.X như sau:
Tính giá trị trung bình của các kênh ảnh (k)
Tính hiệp phương sai giữa các giá trị của pixel ở kênh k và l
T
Covkl E X X (4)
Lập ma trận hiệp phương sai giữa các giá trị của pixel ở dữ liệu ảnh mới:
T
x E Z z Z z
(5)
Trong đó: z E Z E AX A E X. Ax
Trang 51
z - vector giá trị trung bình của các kênh ở ảnh thành phần chính (ảnh mới); x - vector giá trị trung bình của các kênh ở ảnh gốc.
Do đó: z E AX AxX xt
T T
z AE X x X x A
Hay z A x AT
Để ảnh thành phần chính không tương quan thì z phải là ma trận chéo.
Tìm ma trận A trong phương trình Z = A.X, cần phải xác định vector riêng và các giá trị riêng của x. Những giá trị riêng nhận được thông qua giải phương trình: x I 0 , với I là ma trận đơn vị.
Kết quả tạo ra ảnh thành phần chính không tương quan có z là ma trận chéo của các giá trị riêng của x.