b, phổ khoáng vật chứa nước (Hunt, 1980) c, phổ phản xạ của các khoáng vật cacbonat.
3.1.2 Các bước tính thành phần chính
Để nhận bộ dữ liệu ảnh mới không tương quan (ảnh thành phần chính) Z=A.X, ta có thể áp dụng phép biến đổi thành phần chính với số kênh bất kỳ theo các bước tính toán sau:
- Bước 1: Tính giá trị trung bình của mỗi kênh ảnh (µk):
µk = (3.3)
- Bước 2: Tính hiệp phương sai giữa các giá trị của pixel ở kênh k và kênh l: = E (3.4)
Ckl = (3.5)
Trong đó: E là một kỳ vọng toán học
Ckl: là hiệp phương sai giữa hai kênh ảnh k và l Khi đó, ta được ma trận hiệp phương sai C:
C=
- Bước 3: Lập ma trận hiệp phương sai giữa các giá trị pixel ở dữ liệu ảnh mới:
= E (3.6)
Trong đó:
• µz = Eµx là vector giá trị trung bình của các kênh ảnh ở thành phần
chính (ảnh mới);
• µx là vector giá trị trung bình của các kênh ảnh gốc. Do đó:
= = Hay:
= (3.7)
Để ảnh thành phần chính không tương quan thì phải là ma trận đường chéo.
- Bước 4: Tìm ma trận A trong phương trình Z= A.X, cần phải xác định vector và các giá trị riêng của . Những giá trị riêng nhận được thông qua giải phương trình:
= 0 (3.8)
Với I là ma trận đơn vị. - Bước 5: Tính các vector riêng bi:
bi = 0 (3.9)
Kết quả tạo ra ảnh thành phần chính không tương quan có là ma trận đường chéo của các giá trị riêng của . Trong trường hợp tổng quát, ảnh gốc có k kênh, ma trận hiệp phương sai được tính như sau:
= (3.10)
Các giá trị , , …, có ý nghĩa rất quan trọng trong việc xác định thông tin chứa trong từng thành phần. Tổng các giá trị (trong đó là giá trị riêng ứng với thành phần chính thứ p) cho ta tổng phương sai thể hiện trong toàn bộ thành phần chính. Phần trăm thông tin chứa trong từng thành phần chính được xác định bởi tỷ lệ phần trăm của tổng phương sai và được thể hiện bởi công thức tính như sau:
= (3.11)
Giá trị mới của pixel trong từng thành phần chính được xác định bởi:
= (3.12)
3.2Ứng dụng phương pháp phân tích thành phần chính trong nghiên cứu sự phân bố khoáng sản sét, oxit sắt
Phân tích thành phần chính (Principal Component Analysis) là kỹ thuật chuyển đổi các giá trị độ sáng của pixel và sự chuyển đổi này sẽ nén dữ liệu ảnh bằng cách giữ tối đa lượng thông tin hữu ích và loại bỏ các thông tin trùng lặp (các yếu tố tương quan). Kết quả là dữ liệu ảnh thu được chỉ chứa các kênh ảnh ít tương quan. Sử dụng phương pháp này, ta có thể chiết tách các thông tin của tập dữ liệu, nhằm tập trung vào một số thành phần chính, đồng thời làm nổi bật
các đặc trưng của các đối tượng cần nghiên cứu, giúp nâng cao khả năng giải đoán.
Lựa chọn phân tích thành phần chính có thể được sử dụng để giảm chiều bộ dữ liệu đồng thời làm giảm thiểu sự mất mát thông tin, tăng cường và ánh xạ tương phản phổ giữa 2 vùng phổ khác nhau. Mức độ tương quan giữa 2 kênh phổ có liên quan đến mức độ chứa thông tin giống nhau giữa chúng. Việc lựa chọn các thành phần chính dựa trên cơ sở kiểm tra giá trị vector riêng của việc phân tích thành phần chính để quyết định các thành phần chính sẽ trích xuất thông tin liên quan trực tiếp đến lý thuyết đường cong phản xạ phổ của các đối tượng cụ thể.
Trong phân tích thành phần chính, độ lớn và giá trị vector riêng, trị riêng cung cấp thông tin quan trọng về đặc tính phản xạ phổ của thực vật, đất, đá và các loại khoáng sản, là nguyên nhân của thống kê phương sai được ánh xạ vào mỗi thành phần chính và là cơ sở cho kỹ thuật Crosta.
Trong nghiên cứu này, áp dụng phương pháp chuyển đổi thành phần chính cho 6 kênh (kênh 1, 2, 3, 4, 5, 7) của ảnh Landsat ở khu vực ba tỉnh Bắc Cạn – Thái Nguyên - Tuyên Quang. Kết quả thu được thể hiện trong bảng 3.2.
Bảng 3.2. PCA cho ảnh Landsat- 7 của khu vực nghiên cứu
Kênh Kênh 1 Kênh 2 Kênh 3 Kênh 4 Kênh 5 Kênh 7 Trị riêng (%) PC1 0.3375 0.2649 0.2204 0.5760 0.5835 0.3084 95.1157 PC2 -0.0458 0.0681 0.2857 -0.7242 0.3208 0.5331 2.9461 PC3 0.6713 0.4137 0.3388 -0.1719 -0.4657 -0.1301 1.7770 PC4 -0.4107 -0.0009 0.4543 0.3343 -0.5226 0.4900 0.0882 PC5 0.3910 -0.2119 -0.6147 0.0407 -0.2542 0.5984 0.0596 PC6 -0.3344 0.8421 -0.4131 -0.0275 -0.0452 0.0749 0.0135
Kết quả này cho thấy rằng: thành phần chính đầu tiên (PC1) có giá trị dương với tất cả các kênh trong ảnh Landsat. Lượng thông tin chứa trong PC1 là 95,1157% trong tổng phương sai cho dữ liệu thành phần chính. Hay nói cách khác, thành phần chính đầu tiên là hình ảnh phản chiếu bề mặt.
Dựa trên đặc tính phản xạ phổ của thực vật, thực vật ở trạng thái tươi tốt với hàm lượng diệp lực cao trong lá cây sẽ có khả năng phản xạ phổ cao ở bước sóng xanh lá cây (green), giảm xuống ở vùng bước sóng đỏ (read) và tăng rất mạng ở vùng sóng cận hồng ngoại (NIR). Như vậy, vector riêng của PC2 chỉ ra rằng, PC2 chủ yếu là thực vật, vì nó phản xạ rất cao kênh cận hồng ngoại (kênh 4). Giá trị của kênh 4 trong PC2 là -0.7242 cho thấy, ảnh PC2 làm nổi bật khu vực có nhiều thực vật ở các pixel màu tối. Mặc dù lượng thông tin chứa trong PC2 chỉ là 2,9461%, tuy nhiên PC này lại là thước đo sự phong phú của thực vật ở khu vực nghiên cứu hiệu quả nhất.
Khoáng vật sét được thể hiện bằng các pixel màu tối trên ảnh thành phần chính thứ 4 (PC4). Bởi vì giá trị vector riêng của kênh 5 và kênh 7 trong PC này là ngược dấu, tương ứng là -0.5226 và +0.4900 trên PC4 (bảng 3.2). Chúng ta cũng có thể dự đoán rằng oxit sắt được tìm thấy ở các pixel màu sáng trên ảnh thành phần chính này, do giá trị vector riêng của kênh 1 và kênh 3 trong thành phần chính thứ 4 tương ứng là -0.4107 và +0.4543 ngược dấu (bảng 3.2).
3.3Ứng dụng kỹ thuật Crosta nghiên cứu sự phân bố khoáng sản sét, oxit sắt
Giảm số lượng kênh phổ đầu vào cho phân tích thành phần chính sẽ đảm bảo chắc chắn rằng một số đối tượng sẽ không được ánh xạ và làm tăng khả năng ánh xạ của các đối tượng khác mà mình quan tâm vào một trong những hình ảnh thành phần chính cụ thể. Phương pháp này được gọi là kỹ thuật Crosta. Phương pháp này không yêu cầu hiểu biết chi tiết về các đặc tính phản xạ phổ của các đối tượng quan tâm, cũng như không cần thiết phải hiệu chỉnh khí quyển hay hiệu chỉnh bức xạ. Phân tích thành phần chính từ dữ liệu ảnh đa phổ, hình ảnh kết quả sẽ được đánh giá và phát hiện chính xác từng loại đối tượng trong khu vực quan tâm, giúp nâng cao khả năng giải đoán.
Độ lớn và dấu của giá trị vector riêng (trị riêng) cung cấp thông tin về đặc tính phổ của thảm thực vật, các loại đá, đất và khoáng sản là nguyên nhân của
thống kê phương sai được ánh xạ và mỗi thành phần chính. Đây là cơ sở chính của kỹ thuật Crosta.
Số lượng các kênh đầu vào giảm để tránh một số tương phản phổ riêng biệt và làm tăng cơ hội xác định thành phần chính duy nhất đối với các lớp khoáng sản cụ thể.
Lựa chọn PCA có thể được sử dụng để giảm chiều bộ dữ liệu đồng thời làm giảm thiểu sự mất mát thông tin , tăng cường và ánh xạ tương phản phổ giữa 2 vùng phổ khác nhau. Mức độ tương quan giữa 2 kênh phổ có liên quan đến mức độ chứa thông tin giống nhau giữa chúng. Việc lựa chọn các thành phần chính dựa trên cơ sở kiểm tra giá trị vector riêng của PCA để quyết định các thành phần chính sẽ trích xuất thông tin liên quan trực tiếp đến lý thuyết về đường cong phản xạ phổ của các đối tượng cụ thể. Các phương pháp đưa ra dựa trên việc chọn dữ liệu đầu vào chỉ từ 4 kênh phổ để phân tích thành phần chính. Kỹ thuật này sẽ thực hiện bằng cách sử dụng 4 kênh phổ được lựa chọn để làm nổi bật đặc tính phổ của khoáng sản oxits sắt( hấp thụ mạnh ở kênh 1, kênh 2 và phản xạ cao trong kênh 3) và khoáng sản sét (hấp thụ mạnh ở kênh 7 và phản xạ mạnh ở kênh 5).
Trong lập bản đồ khoáng sản sét, ta sử dụng các kênh 1, 4, 5, 7. Để tránh lập bản đồ oxit sắt thì kênh 2 và kênh 3 không được xem xét. Nhưng cần chú ý rằng, kênh 1 có thể được thay thế bằng kênh 2 và kênh 3. Các thành phần chính có thể giải thích như sau:
- PC1: mô tả sự phản chiếu bề mặt
- PC2: mô tả sự khác biệt giữa dải sóng nhìn thấy và hồng ngoại sóng ngắn - PC3: dùng để hiển thị thảm thực vật ở các pixel sáng
- PC4: làm nổi bật khoáng sản sét ở các pixel tối trong ảnh PC.
Ta có thể lập bản đồ khoáng sản sét trong các pixel sáng bằng cách đảo ngược PC4 và được gọi là hình ảnh Crosta khoáng sản sét(H).
Cách đảo ngược được thực hiện bằng cách sử dụng phương trình:
Ở đây, PC đại diện cho các thành phần chính có nhu cầu cần đảo ngược. Một thuộc tính rất quan trọng của hình ảnh H này là nó có đóng góp tiêu cực từ thảm thực vật trong TM4 (khi đảo ngược) và do đó, khu vực thảm thực vật sẽ không được làm nổi bật và được tách ra (Tangestani và Moore, 2002).
Tương tự, bản đồ oxit sắt thu được bằng cách sử dụng các kênh 1, 3, 4 và 5. Các thành phần chính có thể được giải thích như sau:
- PC1: mô tả sự phản chiếu bề mặt
- PC2: mô tả sự khác nhau giữa SWIR và dải sóng nhìn thấy - PC3 mô tả thảm thực vật
- PC4 làm nổi bật các khoáng sản oxit sắt sau khi phủ nhận.
Vì vậy, PC4 trong chuyển đổi này được gọi là hình ảnh Crosta oxit sắt (F). Oxit sắt cũng có thể được xác định trong hình ảnh PC2. Tuy nhiên giá trị vector riêng của oxit sắt trên các kênh 1, 3, 5 cần tính đến cả kênh 4 của thực vật (Tangestani và Moore, 2002).
Thông tin được lưu trữ trên hình ảnh H và F được kết hợp để tạo ra bản đồ hiển thị sự tập trung nhiều cả khoáng sản sét và oxit sắt là ở các pixel sáng nhất. Hình ảnh mới này được gọi là hình ảnh H+F. Điều này đạt được nhờ phân tích thành phần chính ảnh kết hợp của 2 hình ảnh H và F; Và PC có trị riêng dương từ cả 2 kênh đầu vào sẽ được chọn làm hình ảnh Crosta H + F.
Bằng cách cử dụng kỹ thuật Crosta cho các hình ảnh H, H+F, và F, nơi chúng được kéo giãn, trong sự kết hợp mong muốn, tổ hợp màu sắc các hình ảnh này. Tương ứng, hiển thị hình ảnh Crosta của H, H+F và F trong tổ hợp màu RGB, kết quả trả về là hình ảnh tổ hợp màu xanh đậm mà đới biến đổi là sáng bất thường. Các điểm ảnh màu trắng trong đới biến đổi là vùng có cả 2 loại khoáng sản sét và oxit sắt. Các pixel có màu đỏ tươi đến màu màu da cam là khu vực có nhều khoáng sản sét hơn oxit sắt và khu vực mà pixel có màu sáng lục lam đến màu xanh là khu có nhiều oxit sắt hơn khoáng sản sét.