Đây là phép biến đổi mới nhất áp dụng cho ảnh số. Ý tưởng của DWT cho tín hiệu một chiều như sau: Tín hiệu được chia thành hai phần, phần tần số cao và phần tần số thấp. Hầu hết năng lượng được tập trung ở phần góc cạnh hoặc có kết cấu và thuộc thành phần có tần số cao. Thành phần có tần số thấp lại được chia thành hai phần có tần số cao và tần số thấp. Với các bài toán nén và thủy vân ta chỉ cần áp dụng không quá 5 lần bước phân chia trên. Ngoài ra, từ các hệ số DWT, ta có thể tạo lại ảnh ban đầu bằng quá trình DWT ngược hay IDWT.
Ta có thể mô tả bằng toán học DWT và IDWT như sau: H( k ) hke-jkw Và G( k ) gke-jkw
Là lọc thông thấp và lọc thông cao tương ứng, mà thỏa mãn một vài điều kiện cho việc tái xây dựng ảnh ban đầu. Một tín hiệu F(n) có thể được phân tích đệ quy như sau:
n low i k f 1 ( ) hn-2kfj (n) Và n high i k f 1 ( ) gn-2kfj (n)
Với j=J+1,J,…J0 với fJ+1(k)=F(j),k Z, J+1 là chỉ số mức phân giải cao còn J0 là chỉ số mức phân giải thấp. Các hệ số
) ( 0 k
fjlow . fjhigh0 (k). fjlow0 1(k). fjhigh0 1(k)… fjhigh(k) được gọi là các hệ số của tín hiệu F(n), với flow(k) là phần phân giải nhỏ nhất (xấp xỉ) của F(n) và f high(k)
là phần chi tiết của F(n) tại các giải tần khác nhau. Tín hiệu ban đầu F(n) có thể được xây dựng lại từ các hệ số DWT bằng cách đệ quy như sau:
) (n fjlow = k hn-2k fjk1+ k gn-2kfjhigh1 (k)
Để đảm bảo quan hệ giữa DWT và IDWT thì H( ) và G( ) phải thỏa mãn điều kiện trực giao sau: |H( )|2
+| G( )|2 =1
Biến đổi DWT và IDWT cho mảng hai chiều MxN có thể được định nghĩa tương tự bằng cách thực hiện các biến đổi một chiều DWT và IDWT cho mỗi chiều tương ứng.
Biến đổi sóng có rất nhiều lợi thế so với các biến đổi khác, đó chính là: -Biến đổi sóng lăn là một mô tả đa độ phân giải của ảnh. Quá trình giải mã có thể được xử lý tuần tự từ độ phân giải thấp cho đến độ phân giải cao.
-Biến đổi DWT gần gũi với hệ thống thị giác người hơn biến đổi DCT vì vậy, có thể nén với tỉ lệ cao bằng DWT mà sự biến đổi ảnh khó nhận thấy hơn nếu dùng DCT với tỉ lệ tương tự.
Biến đổi sóng tạo ra một cấu trúc được gọi là biểu diễn tỉ lệ không gian (scale-space representation). Trong biểu diễn này, các tín hiệu tần số cao được xác định chính xác trong miền điểm ảnh (pixel), còn các tín hiệu tần số thấp được xác định chính xác trong miền tần số.