NÉN ẢNH TRONG VIỄN THÁM

Một phần của tài liệu Kỹ thuật nén ảnh đa phổ landsat bằng phép biến đổi wavelet 3d (Trang 25 - 28)

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT

2.2. NÉN ẢNH TRONG VIỄN THÁM

Hiện nay, có nhiều thuật toán nén ảnh viễn thám khác nhau, nhƣng trong các lược đồ nén thường gồm các thành phần cơ bản: biến đổi, lượng tử và mã hóa [21].

Biến đổi tham gia vào việc loại bỏ tương quan giữa các pixel. Lượng tử hóa là thủ tục xấp xỉ tập giá trị liên tục trong dữ liệu ảnh hoặc chuỗi số liệu đã biến đổi bằng một tập nhỏ hữu hạn và thuận lợi hơn. Bước lượng tử cũng có thể thực hiện sau quá trình ngƣỡng. Tập dữ liệu ảnh hoặc chuỗi số liệu biến đổi đƣợc thu nhỏ lại bởi một nhân tố lƣợng tử trong quá trình lƣợng tử hóa, đồng thời cũng bị loại bỏ nếu giá trị của điểm ảnh hay giá trị biến đổi thấp hơn giá trị ngưỡng được xác định trước trong quá trình ngưỡng. Sự suy giảm chất lượng ảnh nén trong phương pháp nén không bảo toàn xảy ra khi lựa chọn yếu tố lƣợng tử hóa và giá trị của ngƣỡng. Quá trình mã hóa làm giảm tổng số lƣợng bit cần thiết để thể hiện hình ảnh [3].

Quá trình nén ảnh bao gồm những ánh xạ ảnh thành những chuỗi số nhị phân. Một thuật toán nén ảnh tốt sẽ tạo ra những chuỗi nhị phân với chiều dài nhỏ hơn thể hiện của ảnh. Trường hợp tái tạo lại ảnh từ chuỗi mã hóa nhị phân cho ra ảnh hoàn toàn giống với ảnh gốc thì phương pháp nén ảnh được gọi là bảo toàn (lossless compression). Trong nhiều ứng dụng ảnh viễn thám, tái tạo lại chính xác ảnh là không thật sự cần thiết. Trong trường hợp này, người ta có thể chấp nhận một số nhiễu nhẹ trong ảnh để thu được một thể hiện ảnh nhỏ hơn, làm giảm yêu cầu lưu trữ của ảnh. Đây là phương pháp nén ảnh không bảo toàn (lossy compression). Mục đích của nén ảnh không bảo toàn là tạo lại một ảnh đã cho với biến dạng ít nhất, nhưng tổng số bit mã hóa là nhỏ nhất. Quá trình nén ảnh thực hiện giảm kích thước ảnh viễn thám gốc đến một mức phù hợp. Quá trình giải nén thực hiện quá trình ngƣợc lại so với quá trình nén.

2.2.1. Các kỹ thuật nén ảnh trong viễn thám

Trong những năm gần đây, nhiều kỹ thuật nén ảnh đã đƣợc đề xuất cho dữ liệu đa phổ và siêu phổ. Hầu hết những tiếp cận thông qua một quá trình bao gồm 2 giai đoạn. Đầu tiên dữ liệu đƣợc biến đổi qua miền trung gian và đƣợc thể hiện bởi bảng mã hóa; sau đó mã hóa những hệ số đƣợc biến đổi hoặc những bảng mã hóa.

Trang 13 Giai đoạn đầu tiên nhằm cực tiểu hóa tương quan trong kênh và giữa các kênh hoặc sử dụng tương quan đó để giảm dung lượng. Thường thì hầu hết áp dụng phương pháp tiếp cận dựa trên các kỹ thuật biến đổi [13] và/hoặc sử dụng các lượng tử vector (Vector Quantization – VQ) [7].

Hầu hết những kỹ thuật nén ảnh vệ tinh đều khai thác sự tương quan phổ giữa các kênh ảnh hoặc dựa trên sự tương đồng không gian giữa các pixel có cùng giá trị trên một kênh phổ.

 Biến đổi Karhunen-Loeve (KLT) thường sử dụng những ảnh đa phổ để lựa chọn, phân loại đối tượng và loại bỏ tương quan phổ.

 Biến đổi cosine rời rạc (DCT) đƣợc sử dụng thực tế hầu nhƣ trong tất cả các kỹ thuật nén ảnh đơn và video, ví dụ như JPEG và MPEG, để loại bỏ tương quan dư thừa không gian.

 Biến đổi wavelet đã chứng minh đƣợc là rất hữu ích và phổ biến hơn biến đổi DCT. Chuẩn nén JPEG-2000 dựa vào biến đổi wavelet rời rạc (DWT) ngày càng đƣợc sử dụng và cho kết quả nén vƣợt trội so với tiêu chuẩn nén JPEG dựa vào DCT. Một biến đổi wavelet rời rạc hai chiều thu đƣợc một tập các lớp con song trực giao những ảnh bằng cách phân tích ảnh đó ở những tỉ lệ khác nhau sử dụng thuật toán kiến trúc kim tự tháp, và cho phép tốc độ bit nén cao thông qua việc sử dụng hợp lý kỹ thuật phân bố bit (bit – allocation) trong những kênh con [14]. DWT không chỉ lấy ra thông tin không gian mà còn có thông tin phổ.

Nhiều tác giả sử dụng KLT để loại bỏ tương quan phổ, và thuật toán DCT hoặc DWT được sử dụng để loại bỏ tương quan không gian. Ví dụ, Saghri và Tescher [20] và Lee [11] sử dụng KLT sau biến đổi DCT-2D, và Epstein và Amato cùng cộng sự [27] sử dụng KLT và DWT. Các tác giả khác sử dụng DCT kết hợp mã hóa dự đoán (prediction encoding) trong kênh [6]. Kỹ thuật mã hóa dự đoán đòi hỏi phải có các kiến thức kinh nghiệm về chính ảnh đó. Đối với các ảnh có tính phi tuyến cao, các dự đoán này sẽ khó chính xác và kỹ thuật này sẽ cho kết quả không tốt. Tuy nhiên, việc phối hợp các thuật toán khác nhau như vậy thường là hướng tiếp cận chính của các nhà nghiên cứu hiện nay.

Trang 14 Thay vì sử dụng một chiến lƣợc kết hợp, một cho không gian và một cho các kênh phổ, tác giả Abousleman cùng cộng sự [6] đã áp dụng DCT-3D cho những khối dữ liệu 8x8x8 của những ảnh siêu phổ. Tương tự, Tseng cùng cộng sự [26] sử dụng DWT-3D để loại bỏ tương quan một cách đồng thời thông tin phổ và không gian, lấy ra hầu hết những nội dung đại diện nhất của ảnh trong các hệ số wavelet.

Trong nghiên cứu của những tác giả áp dụng phân tích DWT-3D vào dữ liệu siêu phổ, những hệ số wavelet sau đó đƣợc mã hóa sử dụng kỹ thuật mã hóa entropy sau giai đoạn lượng tử vô hướng tối ưu. Tseng cùng cộng sự sử dụng ảnh AVIRIS và thực hiện nén với sự kết hợp khác nhau của các wavelet, các mức phân tích và các mức lƣợng tử. Tuy nhiên, những kỹ thuật này không thích hợp cho dữ liệu đa phổ bởi số kênh phổ ít hơn.

Trong số các phương pháp tiếp cận không biến đổi có những kỹ thuật dựa vào lƣợng tử hóa và phân loại phổ. Gelli và Poggi sử dụng phân loại phổ nhƣ giai đoạn đầu tiên. Nhiều nhà nghiên cứu sử dụng những biến thể khác nhau của lƣợng tử vector (Vector Quantization - VQ). Giải pháp VQ mã hóa một chuỗi các mẫu hơn là mã hóa một mẫu duy nhất và tự động khai thác những phụ thuộc tuyến tính hay phi tuyến. Điều đó thể hiện VQ là tối ƣu giữa những kĩ thuật mã hóa khối, và tất cả những kỹ thuật mã hóa biến đổi có thể được xem xét như một trường hợp đặc biệt của VQ với một vài điều kiện ràng buộc [7]. Trong VQ, mã hóa đƣợc thực hiện bởi xấp xỉ một chuỗi đƣợc mã hóa bằng một vector nằm trong danh sách mã hóa. Việc tạo ra danh sách mã hóa yêu cầu tính toán lớn và mức độ phức tạp sẽ tăng lên theo cấp số nhân với kích thước của khối.

2.2.2. Đánh giá chất lượng nén

Có nhiều tiêu chí khác nhau đƣợc sử dụng để đánh giá và so sánh để chọn thuật toán nén ảnh viễn thám thích hợp. Chất lƣợng ảnh sau khi khôi phục, tỷ lệ nén, thời gian nén và giải nén là một trong các tiêu chí thông dụng nhất để đánh giá khả năng nén của một giải thuật.

Trang 15 Với tiêu chí thời gian nén và giải nén, tiêu chí này chính là độ đo về sự phức tạp của giải thuật. Ngoài ra nó còn phụ thuộc vào sức mạnh của hệ thống tính toán và thường quan trọng đối với những ứng dụng thời gian thực.

Với tiêu chí tỷ lệ nén hay bitrate, chúng biểu thị tỷ số thông tin còn lại sau khi giải thuật nén đƣợc hiện thực và đƣợc tính bởi công thức sau

size(input) bitrate

size(ouput)

 (bpp) (1)

trong đó hàm size cho biết kích thước của file đầu vào và đầu ra. Việc các file được nén với bitrate lớn sẽ rất thuận lợi cho việc chuyển tải dữ liệu và lưu trữ.

Với tiêu chí chất lƣợng ảnh sau khi khôi phục, thông tin mất có thể đƣợc miêu tả như một hàm toán học của đầu vào và đầu ra quá trình nén. Tiêu chí thường sử dụng trong ảnh viễn thám là độ tương quan CORR giữa các ảnh. Ngoài ra, người ta còn sử dụng chỉ số đánh giá chất lượng ảnh nén là sai số trung bình bình phương (MSE – Mean Square Error) giữa hai ảnh. Đặt f x y( , ) là ảnh đầu vào (kích thước MxN) và f(x, y) là một xấp xỉ của f x y( , ), là kết quả từ việc nén và giải nén ảnh sau đó. Sai số trung bình bình phương, MSE, giữa ( , )f x yf x y( , )là sai số trung bình bình phương của mảng MxN.

1 1 2

0 0

MSE 1 ( , ) ( , )

M N

x y

f x y f x y MN

 

 

 

    (2)

Một yếu tố quan trọng khác để đánh giá chất lƣợng nén là tỉ số nhiễu đỉnh tín hiệu giữa hai ảnh, kí hiệu PSNRdB. Ảnh viễn thám với độ phân giải bức xạ là k thì PSNRdB, có thể đƣợc định nghĩa:

2

dB 10

(2 1)

PSNR 10log

MSE

k  

  

  (dB) (3)

Một phần của tài liệu Kỹ thuật nén ảnh đa phổ landsat bằng phép biến đổi wavelet 3d (Trang 25 - 28)

Tải bản đầy đủ (PDF)

(77 trang)