Phương pháp này có hiệu suất nén cao hơn rất nhiều so với phương pháp nén dự đoán bởi vì chính các phép biến đổi sử dụng các thuộc tính nén năng lượng của mình đã gói gọn toàn bộ năng lư
Giới thiệu về nén ảnh
Sự cần thiết của công nghệ nén
Ngày nay, ứng dụng truyền Video và Hình ảnh trên Internet và Truyền hình ngày càng phổ biến Tuy nhiên, dữ liệu Video và Hình ảnh không nén có kích thước rất lớn, điều này gây khó khăn trong việc lưu trữ và truyền tải Ví dụ, kích thước của dữ liệu không nén có thể lên đến hàng gigabyte, làm cho việc quản lý và chia sẻ trở nên thách thức hơn.
Kích thước không nén Văn bản 11”x8.5” Có độ phân giải khác nhau
Tín hiệu thoại 1s 8 bps 64kbit Ảnh xám 512x512 8 bpp 2mbits Ảnh màu 512x512 24 bpp 6.26 mbits
B ng 1-1 Yả êu cầu v ề không gian lưu trữ ủ c a các loại dữ liệ u không nén
Ảnh số, dữ liệu audio và video đều cần một không gian lưu trữ lớn, do đó, việc nén dữ liệu trước khi lưu trữ hoặc truyền đi là cần thiết Quá trình giải nén sẽ diễn ra khi người dùng muốn sử dụng dữ liệu Với tỷ lệ nén 16:1, không gian lưu trữ yêu cầu giảm được 16 lần so với dung lượng ban đầu.
Nguyên lý nén ảnh
Hình ảnh chứa đựng nhiều thông tin, dẫn đến yêu cầu cao về không gian lưu trữ và băng thông truyền tải Việc lưu trữ và truyền tải hình ảnh với kích thước gốc rất tốn kém Do đó, việc tối ưu hóa kích thước hình ảnh là cần thiết để giảm chi phí và tăng hiệu quả truyền tải.
Trong quá trình nén ảnh, việc giảm thiểu độ dư thừa thông tin là rất quan trọng, bởi vì các pixel ở cạnh nhau thường có tương quan lớn, dẫn đến việc mã hóa không tối ưu Để cải thiện hiệu quả nén, cần tìm kiếm các biểu diễn ảnh với tương quan nhỏ hơn Thực tế, có hai kiểu dư thừa thông tin được phân loại, cần được xem xét để tối ưu hóa quy trình nén ảnh.
Dư thừa trong miền không gian đề cập đến mối tương quan giữa các giá trị pixel trong ảnh, cho thấy rằng các pixel lân cận thường có giá trị tương tự nhau, ngoại trừ những pixel nằm ở biên của ảnh.
- Dư thừa trong miền tần số: Tương quan giữa các mặt phẳng màu hoặc dải phổ khác nhau
Nghiên cứu về nén ảnh tập trung vào việc giảm số bit cần thiết để biểu diễn ảnh, thông qua việc loại bỏ dư thừa trong cả miền không gian và miền tần số Mục tiêu là tối ưu hóa quá trình nén mà vẫn đảm bảo khả năng khôi phục thông tin trong ảnh một cách chính xác.
Tỷ số nén là tham số quan trọng đánh giá khả năng nén của hệ thống, công thức được tính như sau:
Tỉ số nén được tính bằng cách chia kích thước dữ liệu gốc cho kích thước dữ liệu nén Đối với ảnh tĩnh, kích thước được xác định bằng số bít cần thiết để biểu diễn toàn bộ bức ảnh, trong khi đó, đối với video, kích thước tương ứng là số bít dùng để biểu diễn một khung hình video.
Bộ mã hoá đặc trưng
Hình 1-1Mô hình bộ mã hoá ảnh
Hình trên là một hệ thống nén ảnh có tổn hao đặc trưng, gồm: (a) Mã hoá nguồn hay Biến đổi tuyến tính, (b) Lượng tử hoá và (c) Mã hoá entropy
Lượng tử hoá đơn giản giảm bớt các giá trị đầu vào sai khác Có ba phương pháp lượng tử hoá:
Lượng tử hóa vô hướng giống nhau (Uniform Scalar Quantization) chia vùng dữ liệu thành các khoảng đều nhau, ngoại trừ biên Giá trị dữ liệu đầu ra được xác định tại điểm giữa của mỗi khoảng Có hai loại lượng tử hóa vô hướng: quantizer midrise với số lượng mức ra lẻ và quantizer midtreat với số lượng mức ra chẵn.
Lượng tử hóa vô hướng khác nhau (Nonuniform Scalar Quantization) là phương pháp phân chia vùng dữ liệu thành các khoảng không đều nhau, cho phép tối ưu hóa tỷ số tín hiệu trên nhiễu (SNR) cho từng kiểu tín hiệu cụ thể Một trong những kỹ thuật nổi bật trong phương pháp này là Companded quantizer.
- Vector Quantization (VQ): Lượng tử hoá thực hiện trên một nhóm hệ số đồng thời
Bộ mã hoá Entropy thực hiện nén có tổn hao, sẽ đạt được hiệu quả nén cao hơn
Mã hóa entropy phổ biến nhất bao gồm mã hóa Huffman và mã hóa Arithmetic Tuy nhiên, trong các ứng dụng cần xử lý nhanh, mã hóa loạt dài (Run Length Encoding - RLE) thường mang lại hiệu quả tốt hơn.
Kỹ thuật mã hoá/nén ảnh có thể chia thành hai loại:
Mã hóa dự đoán (predictive coding) sử dụng các giá trị thông tin đã có để dự đoán các giá trị khác, chỉ mã hóa sự sai lệch giữa chúng Phương pháp này đơn giản và hiệu quả trong việc khai thác các đặc tính cục bộ của bức ảnh.
Kỹ thuật DPCM chính là một ví dụ điển hình của phương pháp này
Sai lệch giữa ảnh gốc và ảnh dự đoán vẫn mang ý nghĩa quan trọng sau khi lượng tử hóa, điều này cho thấy phương pháp mã hóa dự đoán có khả năng truyền tải nhiều dữ liệu hơn so với các phương pháp khác.
Mã hoá dựa trên phép biến đổi
Mã hoá dựa trên phép biến đổi (transform based coding) thực hiện như sau:
Để chuyển đổi sự biểu diễn ảnh từ miền không gian sang miền biểu diễn khác, trước tiên cần thực hiện các phép biến đổi ảnh Một trong những phép biến đổi thường được sử dụng là DCT (Biến đổi Cosin rời rạc).
The article discusses the discrete cosine transform (DCT), discrete wavelet transform (DWT), and lapped transforms (LT) It emphasizes the importance of encoding these transformation systems for effective data processing.
Phương pháp nén này có hiệu suất vượt trội so với phương pháp nén dự đoán, nhờ vào việc sử dụng các phép biến đổi để tận dụng thuộc tính nén năng lượng Nó cho phép gói gọn toàn bộ năng lượng của bức ảnh chỉ với một số ít hệ số, trong khi các hệ số không quan trọng sẽ bị loại bỏ sau quá trình lượng tử hóa, giảm thiểu đáng kể lượng dữ liệu cần truyền.
Kỹ thuật mã hoá băng con (subband coding) chia băng tần tín hiệu (ảnh) thành nhiều băng con Mỗi băng con được mã hoá bằng một bộ mã hoá và tốc độ bít phù hợp với tính chất thống kê của nó.
Tiêu chuẩn đánh giá chất lượng mã hoá ảnh
Để đánh giá chất lượng hình ảnh sau khi mã hóa, hai tham số quan trọng thường được sử dụng là Sai số bình phương trung bình (MSE) và tỷ số tín hiệu trên nhiễu đỉnh (PSNR).
MSE thường được gọi là phương sai lượng tử - (Quantization Error Variance) MSE giữa ảnh gốc và ảnh khôi phục được tính như sau:
Trong đó: Tổng lấy theo j và k tính là tổng tất cả các điểm ảnh trong ảnh và N là số điểm ảnh
PSNR (Peak to Signal to Noise Ratio)
Công thức tính giữa hai ảnh như sau:
(1.2) Trong đó b là bít cho m i đi m nh, ỗ ể ả RMSElà căn bậc 2 c a ủ
Thông thường, n u ế thì mắt người gần như không phân biệt được ảnh gốc và ảnh khôi phục
Mật độ tham số khác nhau trong các hệ thống viễn thông là yếu tố quan trọng để đảm bảo tính hiệu quả và độ tin cậy Tuy nhiên, việc áp dụng công thức dB cho hệ thống né ảnh cũng cần được xem xét kỹ lưỡng để tối ưu hóa hiệu suất.
Độ phân giải thời gian – tần số và nguyên lý bất định
Độ phân giải của tín hiệu có chiều dài hữu hạn là số mẫu tối thiểu cần thiết để biểu diễn tín hiệu đó, liên quan đến nội dung thông tin của tín hiệu Đối với tín hiệu có chiều dài vô hạn và năng lượng hữu hạn, chiều dài của tín hiệu được định nghĩa là khoảng chứa hầu hết thông tin (ví dụ, 90% năng lượng) Trong tín hiệu liên tục, thay đổi tỷ lệ không ảnh hưởng đến độ phân giải, vì nó tác động đồng thời đến tốc độ lấy mẫu và chiều dài tín hiệu, giữ cho số mẫu cần thiết là hằng số Đối với tín hiệu rời rạc, quá trình lấy mẫu và nội suy không làm ảnh hưởng đến độ phân giải, do các mẫu nội suy dư thừa Tuy nhiên, việc giảm độ phân giải có thể dẫn đến mất mát thông tin không thể khôi phục.
Khi nhận tỷ lệ, độ nét sẽ thay đổi theo thời gian hoặc tần số, nghĩa là chỉ đáp ứng một trong hai yêu cầu này Độ nét trong ngữ cảnh này được gọi là độ phân giải theo thời gian - tần số.
Năng lượng của tín hiệu được định nghĩa như sau: (1.4) Tín hiệu f(t) được gọi là tín hiệu có tâm năng lượng tại a nếu
Xét tín hiệu năng lượng bằng 1 với tâm năng lượng tại gốc tọa độ f(t) và biến đổi Fourier F(w) thỏa mãn các điều kiện nhất định Độ rộng thời gian của f(t) và độ rộng tần số được xác định qua các công thức cụ thể Nguyên lý bất định chỉ ra rằng độ rộng tần số sẽ triệt tiêu nhanh hơn khi độ rộng thời gian tăng lên.
Dấu “=” xảy ra khi gọi là tín hiệu Gauss.
Nguyên lý bất định đóng vai trò quan trọng trong việc xác định giới hạn tối đa của độ nét trong cả thời gian và tần số Điều này có nghĩa là việc nhân tỷ lệ không ảnh hưởng đến độ rộng tích của thời gian và tần số.
Kỹ thuật mã hoá dựa trên phép biến đổi
Phép biến đổi Fourier
Phép biến đổi Fourier được thực hiện dựa trên cơ sở phân tích một tín hiệu thành tổng của các hàm sin với các tần số khác nhau
Nói cách khác, phép biến đổi Fourier (FT) là kỹ thuật biến đổi tín hiệu từ
14 miền thời gian sang miền tần số Với nhiều tín hiệu, phân tích Fourier rất có ích vì nội dung tần số của tín hiệu là rất quan trọng
Biến đổi Fourier của tín hiệu x(t) và biến đổi Fourier ngược của nó được xác định bởi biểu thức sau:
(1.10) Trong đó x(t) và X(f) được gọi là cặp biến đổi Fourier
Mặc dù phép biến đổi Fourier có nhiều ưu điểm như phân tích tín hiệu tuần hoàn và hỗ trợ cho các phép chập tín hiệu, nhưng nó cũng có những hạn chế đáng kể Khi chuyển đổi sang miền tần số, thông tin về thời gian sẽ bị mất, điều này không ảnh hưởng nhiều đến các tín hiệu tĩnh, nơi thuộc tính không thay đổi theo thời gian Tuy nhiên, trong thực tế, nhiều tín hiệu thường gặp như tín hiệu nhạc hay tín hiệu nhiễu lại là tín hiệu không dừng, chứa các thông số động như trôi, nghiêng, và biến đổi đột ngột Trong những trường hợp này, phép biến đổi Fourier không cung cấp thông tin hữu ích nào.
1.3.2 Phép b ến đổi Fourier thời gian ngắn i Để khắc phục những hạn chế của biến đổi FT, phép biến đổi FT thời gian ngắn STFT (Short Term Fourier Transform) ra đời Điểm khác bi t nh gi a STFT và FT ệ ỏ ữ là: trong biến đổi STFT, tín hiệu được chia thành các kho ng nh và trong kho ng ả ỏ ả đó, tín hiệu được gi nh là tín hi u ả đị ệ ổn định B ng cách ch n m t hàm c a s ằ ọ ộ ử ổ có độ dài của cửa sổ đúng bằng khoảng tín hiệu đã phân chia, ta có thể thu được đáp ứng tần số thời gian của tín hiệu một cách đồng thời mà phép biến đổi FT không - thực hiện được
Biến đổi STFT gặp hạn chế về độ chính xác trong việc phân giải thời gian và tần số, điều này bị ảnh hưởng bởi nguyên lý bất định Heisenberg Các phương trình cơ bản không thể cung cấp biểu diễn chính xác về thời gian và tần số của tín hiệu.
Các thành phần phổ tồn tại trong một khoảng thời gian nhất định, nhưng không thể xác định chính xác khoảng thời gian cụ thể mà dải tần số đó tồn tại.
Việc lựa chọn hàm cửa sổ cho phân tích tín hiệu rất quan trọng và phụ thuộc vào ứng dụng cụ thể Nếu các thành phần tần số trong tín hiệu nguyên bản tách biệt, chúng ta có thể chấp nhận độ phân giải tần số thấp để cải thiện độ phân giải thời gian Ngược lại, khi các thành phần phổ không tách biệt, việc chọn cửa sổ phù hợp trở nên khó khăn hơn.
1.3.3 Đa phân giải và Biến đổi Wavelet
Dựa trên những hạn chế của biến đổi STFT, biến đổi Wavelet đã được phát triển, mang lại nhiều ưu điểm vượt trội hơn so với STFT.
Trong phân tích tín hiệu, sự chuyển đổi thời gian tần số (STFT) có tính chất tuyến tính, trong khi biến đổi Wavelets cho phép thay đổi thang độ và dịch thời gian một cách linh hoạt Độ phân giải thời gian và tần số trong STFT là độc lập với tần số phân tích, ngược lại, trong biến đổi Wavelets, độ phân giải thời gian tỷ lệ thuận với tần số phân tích, trong khi độ phân giải tần số lại tỷ lệ nghịch với tần số phân tích.
Hàm c a s ử ổ của STFT là một hàm thông th p còn hàm Wavelet m ấ ẹ là một hàm thông dải
Biến đổi wavelets nổi bật tính cục bộ của tín hiệu, trong khi biến đổi Fourier chỉ nhận biết tính đều đặn toàn cục hoặc trong một cửa sổ nhất định Phép biến đổi wavelet có khả năng cách ly các điểm gián đoạn khỏi phần còn lại của tín hiệu, và phản ứng của nó tại các khu vực gần điểm gián đoạn sẽ làm nổi bật sự khác biệt này.
Đa phân giải và Biến đổi Wavelet
Dựa trên những hạn chế của biến đổi STFT, biến đổi Wavelet đã được phát triển và mang lại nhiều ưu điểm vượt trội hơn.
Biến đổi Fourier ngắn hạn (STFT) và biến đổi Wavelets có những điểm khác biệt quan trọng về tính chất phân giải Trong STFT, độ phân giải thời gian và tần số là độc lập với tần số phân tích, trong khi đó, trong biến đổi Wavelets, độ phân giải thời gian tỷ lệ thuận với tần số phân tích, còn độ phân giải tần số lại tỷ lệ nghịch với tần số phân tích Điều này cho thấy rằng biến đổi Wavelets cho phép thay đổi linh hoạt về thang độ và dịch thời gian của hàm, mang lại những lợi ích trong việc phân tích tín hiệu phi tuyến tính.
Hàm c a s ử ổ của STFT là một hàm thông th p còn hàm Wavelet m ấ ẹ là một hàm thông dải
Biến đổi wavelets nổi bật tính cục bộ của tín hiệu, trong khi biến đổi Fourier chỉ nhận biết tính đều đặn toàn cục hoặc trong một cửa sổ nhất định Phép biến đổi wavelet có khả năng cách ly điểm gián đoạn khỏi phần còn lại của tín hiệu, và đáp ứng tại khu vực gần điểm gián đoạn sẽ làm nổi bật đặc điểm này.
Biến đổi Wavelets mạnh mẽ nhờ vào khả năng phân tích tín hiệu ở nhiều tần số và độ phân giải khác nhau thông qua phương pháp đa phân giải (Multiresolution).
Khi phân tích tín hiệu, ta nhận thấy rằng ở các tần số cao, phân giải thời gian tốt nhưng phân giải tần số kém, trong khi ở các tần số thấp, phân giải tần số tốt nhưng phân giải thời gian kém Điều này khiến biến đổi này trở nên lý tưởng cho những tín hiệu có thành phần tần số cao xuất hiện trong khoảng thời gian ngắn và thành phần tần số thấp xuất hiện trong khoảng thời gian dài, như ảnh, khung hình video, và các tín hiệu điện não đồ (EEG), điện cơ đồ (EMG), và điện tâm đồ (ECG).
Cơ sở toán học cũng như các tính chất của biến đổi Wavelet liên tục sẽ được trình bầy chi tiết trong chương 2.
Tổ chức luận văn
Mục tiêu của luận văn là nghiên cứu lý thuyết Wavelet, trình bày các đặc điểm chi tiết của Wavelet và các ứng dụng của nó Đặc biệt, luận văn sẽ nhấn mạnh ứng dụng của Wavelet trong lĩnh vực xử lý ảnh, nhằm làm nổi bật hiệu quả và tiềm năng của phương pháp này.
Bài toán đặt ra là sử dụng biến đổi Wavelet thông thường và biến đổi Wavelet định hướng để đánh giá hiệu quả xử lý ảnh cho các ảnh đầu vào khác nhau, với trọng tâm đặc biệt vào hiệu quả của biến đổi Wavelet định hướng.
Dựa trên yêu cầu của đề tài "Nghiên cứu phân tích xử lý ảnh bằng phương pháp Wavelet định hướng", luận văn của tôi được cấu trúc một cách hợp lý để trình bày các nội dung chính và kết quả nghiên cứu.
Giới thiệu chung một số khái niệm trong luận văn, trình bày mục đích, nội dung và những yêu cầu đặt ra trong luận văn
Trình bày cơ sở của lý thuyết Wavelet, những đặc điểm quan trọng của các dạng Wavelet khác nhau và ứng dụng của Wavelet
Chương 3: Ứng dụng Wavelet định hướng trong xử lý ảnh
Chương ba trình bày ỹ thuật xử lý ảnh sử dụng biến đổi k Wavelet nói chung và đặc biệt đi sâu nghiên cứu, phân tích biến đổi Wavelet định hướng
Chương 4: Mô phỏng và kết luận
Chương bốn trình bày chương trình mô phỏng ứng dụng Wavelet và Wavelet định hướng trong xử lý ảnh, được phát triển bằng Matlab Bài viết cung cấp các kết quả mô phỏng và tiến hành phân tích những kết quả này.
Lý thuyết Wavelet
Giới thiệu chung về Wavelet
Ý tưởng cơ bản của Wavelet là phân tích dữ liệu theo tỷ lệ, sử dụng các hàm Wavelet đáp ứng yêu cầu toán học để biểu diễn dữ liệu hoặc các hàm khác Khái niệm về phép xấp xỉ với các hàm xếp chồng đã được phát triển từ thế kỷ 18, khi Joseph Fourier phát hiện ra khả năng xếp chồng các hàm sin và cosin để biểu diễn một hàm khác.
Trong phân tích Wavelet, tỷ lệ đóng vai trò quan trọng trong việc xử lý dữ liệu theo nhiều độ phân giải khác nhau Khi sử dụng cửa sổ lớn để quan sát tín hiệu, chúng ta có thể nhận diện các đặc điểm chung, trong khi việc sử dụng cửa sổ nhỏ hơn giúp phát hiện những chi tiết tinh vi hơn trong dữ liệu.
Quy trình phân tích wavelet bao gồm việc chọn một hàm Wavelet nguyên mẫu, được gọi là Wavelet phân tích hay Wavelet mẹ Phân tích thời gian sử dụng dạng co lại, tần số cao của Wavelet mẹ, trong khi phân tích tần số sử dụng dạng giãn ra, tần số thấp của cùng Wavelet mẹ.
Tín hiệu nguyên bản hoặc hàm có thể được biểu diễn qua khai triển Wavelet, cho phép thực hiện các tính toán dữ liệu bằng cách sử dụng các hệ số Wavelet tương ứng.
Chọn Wavelet phù hợp với dữ liệu và loại bỏ các hệ số dưới một ngưỡng nhất định giúp chúng ta thu được dữ liệu rời rạc Mã hoá rời rạc (sparse coding) làm cho Wavelet trở thành công cụ xuất sắc trong nén dữ liệu.
Wavelet được ứng dụng rộng rãi trong nhiều lĩnh vực như thiên văn học, âm học, kỹ thuật hạt nhân, mã hóa băng con, xử lý tín hiệu và hình ảnh, bệnh học thần kinh, âm nhạc, ảnh cộng hưởng từ (MRI), quang học, fractals, turbulence, dự báo động đất, radar, và các lĩnh vực toán học như giải phương trình vi phân từng phần.
Wavelet là tập hợp các hàm số có tính chất địa phương hóa trong thời gian và không gian Chúng được tạo ra từ một hàm đơn, gọi là hàm Wavelet mẹ, thông qua các phép tịnh tiến và co giãn Để được coi là hàm Wavelet, các hàm này cần phải đáp ứng một số điều kiện nhất định.
Với là biến đổi Fourier của :
V i m t hàm Wavelet m ớ ộ ẹ cho trước, , ta xây dựng được h các ọ Wavelet b ng phép t nh ti n và co giãn t ằ ị ế ừ như sau:
Ví dụ, một số hàm wavelet mẹ thường dung:
Biến đổi wavelet liên tục
(2.7) a: thông số dịch chuyển; b: thông số tỷ lệ và chuẩn
: yếu tố bình thường hoá đảm bảo cho các wavelet có cùng mức năng lượng
Cho hàm wavelet m ẹ có giá trị thực, m t hàm bộ ất kỳ :
Công th c t ng h p: ứ ổ ợ ; được gọi là các hệ số khai triển chuỗi wavelet
Biến đổi Wavelet rời rạc (Discrete wavelet transform)
Biến đổi Wavelet rời rạc (DWT) được giới thiệu để giảm bớt sự dư thừa do các hàm Wavelet được định nghĩa cho mọi điểm trong không gian (a, b) DWT dựa trên cơ sở mã hoá băng con, giúp thực hiện dễ dàng, tiết kiệm thời gian tính toán và giảm yêu cầu về tài nguyên.
Cơ sở của Đạo hàm Wavelet rời rạc (DWT) được thiết lập từ năm 1976, đánh dấu sự phát triển của các kỹ thuật phân tích tín hiệu rời rạc Nghiên cứu về DWT cũng đã được áp dụng trong lĩnh vực mã hóa tín hiệu âm thanh, thường được gọi là mã hóa băng con (sub-band coding).
1983, các kỹ thuật tương tự kỹ thuật mã hoá băng con được phát triển được gọi là
21 mã hoá hình chóp (pyramidal coding) và dẫn đến sơ đồ phân tích đa phân giải (MRA) [3]
Trong biến đổi Wavelet liên tục, tín hiệu được phân tích thông qua một tập hợp hàm cơ sở liên quan bởi hệ số tỷ lệ (a) và hệ số tịnh tiến (b) Ngược lại, biến đổi Wavelet rời rạc sử dụng các kỹ thuật lọc số để thu được biểu diễn thời gian – tỷ lệ của tín hiệu số Quá trình phân tích tín hiệu diễn ra qua các bộ lọc với tần số cắt khác nhau ở các tỷ lệ khác nhau.
2.3.1 P hân tích đa phân giải
Một tín hiệu được phân chia thành các thành phần thô và chi tiết, trong đó hai không gian con này là trực giao Tín hiệu chi tiết được xác định là hiệu giữa phiên bản thô và phiên bản tinh của tín hiệu Bằng cách áp dụng các dãy xấp xỉ một cách đệ quy, không gian tín hiệu đầu vào có thể được sinh ra từ các không gian của dãy xấp xỉ ở mọi độ phân giải Khi độ phân giải chi tiết tiến đến vô cùng, sai số xấp xỉ sẽ tiến đến 0 Độ phân giải này, được phát triển bởi Mallat và Meyer, không chỉ là nền tảng cho Wavelet mà còn là công cụ toán học mạnh mẽ để liên kết Wavelet và phân tích băng con tín hiệu Định nghĩa về phân tích đa phân giải bao gồm một chuỗi các khối không gian con đóng.
- Tồn tại sao cho là một cơ sở trực chuẩn
Biến đổi wavelet rời rạc là một phương pháp quan trọng trong xử lý tín hiệu, cho phép phân tích và biểu diễn các tín hiệu trong không gian đa phân giải Hình 2-1 minh họa không gian và các không gian con, trong đó không gian 2 biểu diễn toàn bộ không gian, trong khi các không gian con cho phép thể hiện chi tiết cụ thể hơn.
Khai triển wavelet nổi bật với cấu trúc đa phân giải, giúp phát triển một giải thuật rời rạc thời gian hiệu quả Giải thuật này, được đề xuất bởi Mallat, sử dụng một dải lọc để thực hiện quá trình phân tích.
Sử dụng phân tích đa phân giải x( ) được phân tách thành nhiền mức khác nhau:t
: wavelet rời rạc dung phân tích
: hàm tỷ lệ rời rạc
: tín hiệu chi tiết (hệ số wavelet) tại mức
: tín hiệu xấp xỉ (hệ số tỷ lệ) tại mức
Cơ sở wavelet rời rạc gồm hai hàm cơ bản:
Trường hợp cơ sở trực chuẩn:
- Cơ sở phân tích tín hiệu trùng với cơ sở tổng hợp tín hiệu
- Cơ sở gồm hai hàm cơ bản: và
Trường hợ cặp cơ sở trực giao:p
- Cơ sở phân tích tín hiệu khác với cơ sở tổng hợp tín hiệu
- Cơ sở phân tích tín hiệu gồm hai hàm cơ bản: và
- Cơ sở tổng hợp tín hiệu gồm hai hàm cơ bản: và
Dãy bộ lọc hai kênh: Hai hàm cơ sở của wavelet rời rạc chính là những hệ số của hai bộ lọc thông thấp và thông cao
2.3.3 Phân tích đa phân giải sử dụng băng lọc
Trong lĩnh vực xử lý tín hiệu, bộ lọc đóng vai trò quan trọng và được sử dụng rộng rãi Wavelet có thể được thực hiện thông qua các bộ lọc lặp lại với tỷ lệ thay đổi, giúp cải thiện độ phân giải của tín hiệu Độ phân giải này là tiêu chuẩn để đánh giá mức độ chi tiết thông tin trong tín hiệu, và nó được xác định bởi các quá trình lọc Tỷ lệ này phụ thuộc vào quá trình phân chia (upsampling) và nội suy (downsampling), còn được gọi là lấy mẫu con (subsampling).
Biến đổi Wavelet rời rạc được thực hiện thông qua quá trình lọc thông thấp và thông cao liên tiếp của tín hiệu rời rạc theo thời gian, được gọi là thuật toán Mallat hay phân tích cây Mallat Thuật toán Mallat đóng vai trò quan trọng trong việc kết nối sự đa phân giải liên tục theo thời gian với các bộ lọc rời rạc.
Khởi đầu quá trình, tín hiệu được chiếu lên với j được xác định bởi tần số lấy mẫu Trong thực tế, các hệ số tỷ lệ sẽ được thay thế bằng các giá trị mẫu tương ứng.
1 Chia các hệ số xấp xỉ thành hai phần xấp xỉ và chi tiết nhờ sử dụng và
2 Thay đổi tỷ lệ các hệ số xấp xỉ
3 Tiếp tục chia phần xấp xỉ thành hai phần xấp xỉ và chi tiết như bước (1)
4 Lặp lại bước (2) và (3)cho đến khi đạt được kết quả thoả mãn.
(b) Quá trình tổng hợp Hình 2-2 Thu t toán hình chóp hay thuậ ật toán mã hoá băng con
Trong hình vẽ 2-2, tín hiệu được được bi u th b i dãy ể ị ở , v i là s nguyên ớ ố
Bảng cáo thông cao và bảng cáo thông thô được biểu diễn tương ứng với các thông tin chi tiết và kết hợp với hàm tỷ lệ Mỗi bảng cung cấp cái nhìn sâu sắc về dữ liệu, giúp phân tích và đưa ra các số liệu thô một cách hiệu quả.
Các bộ lọc nửa dải (half band filter) tại mỗi mức phân tích cung cấp tín hiệu kéo dài chỉ một nửa băng tần Việc sử dụng các bộ lọc này giúp tăng độ phân
Theo định lý Nyquist, nếu tín hiệu nguyên bản có tần số góc cao nhất là ω rad/s và tần số lấy mẫu là ωs, thì khi tần số góc cao nhất là ω/2, tần số lấy mẫu sẽ là ωs/2 Điều này cho phép loại bỏ một nửa số mẫu cần lấy mà không làm mất thông tin Tuy nhiên, việc lấy mẫu với hệ số chia 2 sẽ giảm một nửa độ phân giải thời gian, vì toàn bộ tín hiệu giờ đây chỉ được biểu diễn trên một nửa số lượng mẫu.
Độ phân giải thời gian tốt hơn ở tần số cao, trong khi độ phân giải tần số cải thiện ở tần số thấp Quá trình lọc và phân chia diễn ra liên tiếp cho đến khi đạt yêu cầu, và số lượng tối đa các mức phụ thuộc vào độ dài của tín hiệu.
Biến đổi Wavelet r i r c c a tín hiờ ạ ủ ệu thu được nh s xâu chu i (concatenating) ờ ự ỗ các hệ ố s và , bắt đầu từ mức cuối cùng của quá trình phân tích
Hình 2.9b biểu diễn quá trình khôi phục tín hiệu nguyên bản từ các hệ số Wavelet
Quá trình khôi phục cơ bản là sự đảo ngược của quá trình phân tích, trong đó các hệ số xấp xỉ và chi tiết ở mọi mức được nội suy bởi hệ số 2 Các hệ số này được xử lý qua bộ lọc tổng hợp thông thấp và thông cao, sau đó được gộp lại với nhau để hoàn thiện quá trình khôi phục.
Quá trình tiếp tục cho đến đạt được cùng số mức thu được trong quá trình phân tích tín hiệu nguyên bản
Phương pháp hiệu quả nhất để mô tả quy trình và xác định các hệ số wavelet là sử dụng phép toán của các bộ lọc.
Trở ạ l i hai bi u th c (2.41) và (2.44) trong phể ứ ần trước, m i liên h gi a và : ỗ ệ ữ
Chuỗi Wavelet
M t hàm ộ có thể được biểu diễn:
- Tuyến tính: Gi s toán t ả ử ử T được định nghĩa với thì
- Dịch: N u m t tín hi u có m t khai tri n t l h u h n ế ộ ệ ộ ể ỷ ệ ữ ạ thì tín hiệu này sẽ có tính dịch yếu tương ứng được dịch đi , đó là: với
- T l : N u tín hi u f(t) có h s biỷ ệ ế ệ ệ ố ến đổi wavelet là F(m,n) thì
- Đẳng thức Pareval: Họ wavelet trực chuẩn thoả mãn:
Lấy mẫu đôi và Tiling thời gian – tần số:
Quá trình lấy mẫu trong miền thời gian và tần số được thực hiện theo chu kỳ, với tỷ lệ thường được thể hiện dưới dạng số mũ của 2 Khi tần số là đảo của tỷ lệ, wavelet sẽ tập trung quanh tần số đó, dẫn đến việc hình thành một quá trình lấy mẫu đôi giữa miền thời gian và tần số.
Hình 2-4 Lấy mẫu đôi và tiling thời gian
2.4.2 Các tính chất của hàm tỷ lệ
- Phương trình hai tỷ l : Hàm t l có th ệ ỷ ệ ể được xây d ng t ự ừ chính nó Phương trình hai tỷ lệ:
Tương tự đối v i wavelet ớ thì
- Tính chất moment: Bộ lọc thông thấp trong ph n d i l c, nó có ít nhầ ả ọ ất một tại , và vì vậy có ít nh t mấ ột tại Khi
, nó kéo theo có ít ấnh t một tại Do đó:
Một cách tổng quát: Điều đó có nghĩa moment đầu tiên c a wavelet là ủ
2.4.3 Biến đổi chuỗi wavelet của tín hiệu
Wavelet bao gồm ba hàm cơ sở, trong đó hai loại được nghiên cứu nhiều nhất là wavelet trực chuẩn, như Haar và Daubechies, cùng với wavelet cặp trực giao, như B-Spline.
Biến đổi chuỗi wavelet bao gồm hai bước chính: khai triển tín hiệu thành các chuỗi wavelet và tổng hợp chúng để phục hồi tín hiệu gốc Quá trình này có thể được thực hiện bằng cơ sở trực chuẩn hoặc cặp trực giao, với sơ đồ chung nhưng khác nhau ở hàm cơ sở dùng để tổng hợp tín hiệu.
Dựa trên biến đổi wavelet rời rạc, phương pháp phân tích rời rạc đảm bảo mã hóa tiết kiệm không gian, đồng thời cung cấp độ chính xác cần thiết cho việc tái tạo hiệu quả.
Tín hiệu x[n] được phân tích qua dãy bộ lọc băng hai kênh thành hai dãy hệ số co cD và cA Dãy hệ số của nhánh lọc thông thấp cA tiếp tục được phân tích bởi dãy bộ lọc hai kênh tương tự, và quá trình này tiếp tục diễn ra trên nhánh thông thấp Mỗi lần khai triển sẽ tạo ra hai dãy hệ số wavelet mới.
Bộ lọc thông cao tạo ra những hệ số chi tiết
Bộ lọc thông thấp tạo ra những hệ số xấp xỉ
Sơ đồ rút gọn của phân tích các tầng:
Hình 2-5 Sơ đồ phân tích DWT
Sơ đồ tái tạo các tầng:
Phân loại Wavelet
Wavelet có thể được phân loại thành hai dạng chính: trực giao và song trực giao Việc lựa chọn loại Wavelet phù hợp thường dựa trên cơ sở ứng dụng cụ thể.
Đặc điểm của băng lọc Wavelet trực giao
Các hệ số của bộ lọc là số thực và tất cả các bộ lọc đều có độ dài giống nhau cũng như không đối xứng Bộ lọc thông thấp H và bộ lọc thông cao G có mối liên hệ chặt chẽ với nhau.
Here is the rewritten paragraph:Hai bộ lọc được xen kẽ động với nhau, tự động tạo ra tính trực giao double-shift giữa các bộ lọc thông thấp và thông cao Điều này có nghĩa là tích vô hướng của các bộ lọc cho dịch 2 là bằng không, được thể hiện qua công thức H k G k 2 0 với kЄZ Các bộ lọc thoả mãn biểu thức này được gọi là các bộ lọc gương liên hợp CMF (Conjugate Mirror Filters), cho phép khôi phục hoàn hảo với sự xen kẽ động (alternating flip).
Mặc dù các bộ lọc tổng hợp có khả năng khôi phục hoàn hảo và tương tự như bộ lọc phân tích, nhưng các bộ lọc trực giao lại mang lại nhiều momen triệt tiêu Đặc điểm này rất hữu ích trong xử lý tín hiệu và hình ảnh Hơn nữa, cấu trúc cân đối và đều đặn của các bộ lọc trực giao giúp dễ dàng trong việc thực hiện và mở rộng cấu trúc.
Đặc điểm của băng lọc Wavelet song trực giao
Trong bộ lọc Wavelet song trực giao, bộ lọc thông thấp và thông cao có độ dài khác nhau, với bộ lọc thông thấp luôn đối xứng và bộ lọc thông cao thì bất đối xứng Hệ số của các bộ lọc có thể là số thực hoặc số nguyên Để đạt được sự khôi phục hoàn hảo, băng lọc song trực giao cần có độ dài lẻ hoặc độ dài chẵn Hai bộ lọc phân tích có thể cùng đối xứng với độ dài lẻ hoặc một bộ đối xứng và một bộ bất đối xứng với độ dài khác nhau Ngoài ra, hai tập hợp bộ lọc phân tích và tổng hợp cũng phải đối ngẫu Bộ lọc song trực giao pha tuyến tính là lựa chọn phổ biến cho các ứng dụng nén dữ liệu.
Hiện nay, có một số hàm cơ bản được sử dụng làm Wavelet mẹ cho các biến đổi Wavelet Wavelet mẹ này sinh ra tất cả các hàm Wavelet thông qua phép tịnh tiến và lấy tỷ lệ, từ đó xác định các đặc điểm của biến đổi Wavelet kết quả Do đó, việc chọn Wavelet mẹ phù hợp là rất quan trọng để đảm bảo hiệu quả của từng ứng dụng cụ thể.
Biến đổi Wavelet Haar là loại biến đổi đơn giản nhất trong các phép biến đổi Wavelet, được thể hiện qua hàm ψ(t) như mô tả trong hình vẽ 3.16 Nhờ vào tính đơn giản của nó, biến đổi Haar được ứng dụng rộng rãi trong nén ảnh.
Hình 2-7 Hàm của biến đổi Haar Đặc tính của Haar wavelet: Độ rộng xác định = 1; Độ dài bộ lọc = 2; Số moment bằng 0 đối với hàm wavelet = 1
Yves Meyer là một trong những nhà khoa học tiên phong trong lĩnh vực phép biến đổi Wavelet, với phép biến đổi mang tên ông được sử dụng rộng rãi Phép biến đổi Wavelet Meyer là một hàm xác định theo miền tần số, cho phép phân tích tín hiệu hiệu quả hơn nhiều so với biến đổi Haar.
Dạng của hàm ψ(t) với biến đổi Meyer cho ở hình vẽ:
Hình 2-8 Hàm của biến đổi Meyer
Cũng giống như Meyer, Daubechies là một nhà khoa học quan trọng trong nghiên cứu phát triển phép biến đổi Wavelet Biến đổi Daubechies, một trong những phép biến đổi phức tạp nhất trong lĩnh vực này, đã khám phá ra Wavelet trực giao khoảng chặt, mang lại giá trị thực tế cho phân tích wavelet rời rạc Ứng dụng của biến đổi này rất rộng rãi, trong đó biến đổi Wavelet được sử dụng trong JPEG2000 thuộc họ biến đổi Wavelet Daubechies, với ký hiệu là dbN, trong đó N là thứ tự và db là tên họ wavelet.
Dưới đây là một số hàm ψ(t) của họ biến đổi Wavelet Daubechies:
Hình 2-9 Hàm của họ biến đổi Daubechies với Đặc tính của DbN: Độ rộng xác định = 2N 1; – Độ dài bộ lọc = 2N; Số moment bằng 0 đối với hàm wavelets = N
Biến đổi Wavelet song trực giao
Các wavelet thể hiện đặc tính của pha tuyến tính, rất quan trọng cho việc tái tạo tín hiệu và hình ảnh Việc sử dụng hai wavelet, một cho phân tích và một cho tái tạo, thay vì chỉ sử dụng một, đã mang lại những đặc tính thú vị.
Hình 2-10 M t vài hàm ộ của các cặp h biọ ến đổi Biorthogonal
Bior N r và N d có các đặc tính quan trọng như sau: Độ rộng xác định là 2N r + 1 cho tổng hợp và 2N d + 1 cho phân tích Độ dài bộ lọc được tính bằng max(2N r , 2N d ) + 2 Bộ lọc này có tính đối xứng và số moment bằng 0 đối với hàm wavelet là N r 1.
Xây dựng bởi I Daubechies theo đề nghị của R Coifman
Hình 2- Hàm 11 của họ biến đổi Coiflets
= 6N 1; 6N Đặc tính: Độ rộng xác định – Độ dài bộ lọc = ; Gần đối xứng; Số moment bằng 0 đối với hàm wavelets = 2N; Số moment bằng 0 đối với hàm tỷ lệ
Symlets là wavelet gần đối xứng, được đề nghị bởi Daubechies là điều chỉnh của họ db Đặc tính của hai họ là tương tự
Hình 2-12 M t vào hàm ộ của họ ến đổ bi i Symlets
Wavelet này có hàm mức, nhưng rõ ràng
Hình 2-13 Hàm của biến đổi Morlet
Biến đổi Wavelet Mexican Hat
Wavelet này không có hàm mức và là dẫn xuất của một hàm mà tỷ lệ với đạo hàm bậc hai của hàm mật độ xác suất Gauss
Hình 2-14 Hàm của biến đổi Mexican Hat
Biến đổi Wavelet hiện nay có ứng dụng đa dạng trong nhiều lĩnh vực, từ xử lý tín hiệu đến sinh trắc học Phạm vi ứng dụng của biến đổi Wavelet ngày càng được mở rộng, cho thấy tính linh hoạt và hiệu quả của nó trong các ngành công nghiệp khác nhau.
Biến đổi Wavelet là một trong những công nghệ quan trọng trong việc nén dấu vân tay của FBI, giúp lưu trữ hiệu quả trong ngân hàng dữ liệu Trước đây, FBI đã sử dụng biến đổi Cosine rời rạc (DCT), nhưng công nghệ này không đạt hiệu quả cao ở tỷ số nén lớn và gây ra hiện tượng chặn, làm mất đi các đường vân tay sau khi khôi phục Ngược lại, biến đổi Wavelet giữ lại chi tiết quan trọng trong dữ liệu, đảm bảo tính chính xác và độ tin cậy của dấu vân tay.
Biến đổi Wavelet rời rạc giúp xác định thông tin quan trọng qua các biên độ lớn, trong khi thông tin kém quan trọng nằm ở biên độ nhỏ Nhờ vào việc loại bỏ các biên độ thấp, quá trình nén dữ liệu có thể đạt được hiệu quả cao Biến đổi Wavelet cho phép đạt tỷ số nén lớn mà vẫn duy trì chất lượng khôi phục tốt.
Wavelet là công cụ hiệu quả cho việc nén và phân tích tín hiệu không dừng, đặc biệt là trong lĩnh vực ảnh số và nén tiếng nói, dữ liệu Việc áp dụng các phép mã hóa băng con, băng lọc số nhiều nhịp và biến đổi Wavelet rời rạc tương ứng với loại tín hiệu cần phân tích có thể mang lại hiệu quả đáng kể trong việc nén tín hiệu.
Ứng dụng Wavelet định hướng trong kỹ thuật nén ảnh
Giới thiệu
Trong thập kỷ qua, kỹ thuật nén ảnh dựa trên biến đổi wavelet, đặc biệt là biến đổi wavelet rời rạc (DWT), đã phát triển mạnh mẽ và dần thay thế biến đổi Cosine rời rạc (DCT) Chuẩn JPEG2000, dựa trên biến đổi wavelet, không chỉ mang lại hiệu quả nén cao hơn so với chuẩn JPEG cũ mà còn cải thiện khả năng khôi phục chất lượng và độ phân giải trong các ứng dụng người dùng và mạng Biến đổi wavelet 2D vượt trội hơn biến đổi DCT 2D nhờ vào việc sử dụng hai bộ lọc một chiều theo hướng dọc và ngang Tuy nhiên, một hạn chế của biến đổi wavelet thẳng là không đáp ứng được đặc tính bất định hướng của ảnh, dẫn đến nhiễu lượng tử trong các hệ số cạnh ở băng cao.
Để khai thác tối đa mối tương quan về hướng trong ảnh, phương thức mã hóa ảnh sử dụng biến đổi wavelet định hướng là một giải pháp hiệu quả Phương pháp này giúp tối ưu hóa việc phân tích và xử lý ảnh, nâng cao chất lượng hình ảnh và khả năng nhận diện các đặc trưng hướng trong ảnh.
2 loại theo cách sử dụng và mã hoá thông tin hướng:
1) Bộ lọc định hướng và biến đổi: Các bộ lọc định hướng và biến đổi mang lại hiệu quả tốt trong biểu diễn dữ liệu đính hướng trong miền tần số Và do đó được áp dụng rộng rãi nhằm khai thác tính năng, nâng cao chất lượng ảnh, loại bỏ nhiễu
Tuy nhiên, nó không phù hợp với nén ảnh mã hoá entropy, không hiệu quả để khai thác thông tin hướng trong mỗi vùng wavelet
2) Dự đoán hướng: Điểm cốt lõi ở đây là xung đột giữa biến đổi chung và đặc tính riêng từng vùng của ảnh Ảnh gốc thường có rất nhiều hướng Chia ảnh thành nhiền vùng nhỏ theo hướng tương quan có thể gây ảnh hưởng lớn đến vùng biên và hiệu quả mã hoá
Chương này khám phá biến đổi wavelet định hướng, đặc biệt là biến đổi wavelet cho dự đoán dư thừa và biến đổi wavelet dựa trên cơ chế lifting tương thích (Adaptive Directional Lifting - ADL) Các kết quả so sánh với một số biến đổi wavelet định hướng ứng dụng cho ảnh sẽ chỉ ra ưu điểm vượt trội của biến đổi wavelet định hướng so với các phương pháp trước đây.
Tính chất bất đẳng hướng của ảnh và dư thừa dự đoán
Dư thừa dự đoán là các lỗi mã hóa ảnh, với đặc điểm của ảnh thay đổi từ vùng này sang vùng khác, dẫn đến sự biến đổi trong đặc tính dư thừa dự đoán trong mã hóa video Hình 3.1 so sánh ảnh gốc với ảnh dự đoán dư thừa bù chuyển động (MC-residual) và ảnh dự đoán dư thừa nâng cao độ phân giải (RE-residual) Kết quả cho thấy, lỗi dự đoán trong vùng mượt và vùng có sự thay đổi ít của ảnh MC-residual nhỏ hơn so với các vùng có sự thay đổi mạnh hoặc các cạnh Ngược lại, ảnh RE-residual có lỗi dự đoán trong các vùng mượt nhỏ hơn so với các vùng chữ hoặc vùng xung quanh các cạnh.
Hình 3-1 nh gẢ ốc (có độ phân gi i CIF), nh MC-residual và nh RE-ả ả ả residual
Trong dự đoán dư thừa, lỗi chủ yếu xảy ra ở các vùng chữ hoặc dọc theo các cạnh Cấu trúc một chiều thường xuất hiện nhiều trong các vùng dư thừa, với cường độ của nhiều pixel gần 0 ngoại trừ các pixel tại các cạnh Điều này cho thấy rằng biến đổi 2 chiều với các hàm cơ bản hỗ trợ 2 chiều không phải là lựa chọn tốt nhất cho những vùng này Do đó, việc sử dụng biến đổi dựa trên các hàm cơ bản hỗ trợ cấu trúc một chiều trong dư thừa dự đoán là cần thiết, đặc biệt là áp dụng biến đổi DWT định hướng một chiều.
Nguyên lý biến đổi định hướng
Mã hoá video thường chứa thông tin dư thừa, bao gồm dư thừa bù chuyển động (MC-residual), dư thừa nâng cao độ phân giải (RE-residual) và bù chênh lệch DC-residual Các biến đổi nén ảnh như Discrete Cosine Transform (DCT) thường được áp dụng cho nén dư thừa dự đoán, ví dụ như trong chuẩn JPEG và MPEG 2 Bên cạnh đó, Discrete Wavelet Transform (DWT) cũng được sử dụng trong chuẩn nén JPEG2000 và mã hoá wavelet liên ảnh Dư thừa dự đoán có những đặc điểm riêng biệt, góp phần quan trọng vào hiệu quả nén video.
45 tính khác Do đó, một hướng nghiên cứu mới được đặt ra nhằm nâng cao hiệu quả của phép biến đổi trong xử lý ảnh
Gần đây, nhiều nhà nghiên cứu đã phát triển biến đổi wavelet để khai thác các đặc tính dị hướng trong ảnh Biến đổi wavelet rời rạc hai chiều (DWT) đã trở thành một trong những kỹ thuật nén ảnh quan trọng nhất trong vài thập kỷ qua Kỹ thuật này cho phép tối ưu hóa việc lưu trữ và truyền tải dữ liệu hình ảnh.
Biến đổi wavelet DWT thẳng là một phương pháp độc lập, thực hiện hai biến đổi một chiều theo chiều ngang và chiều dọc Tuy nhiên, việc tách rời này dẫn đến việc các moment của bộ lọc wavelet băng cao chỉ tồn tại theo hai hướng, không hiệu quả trong việc khôi phục các đặc tính dị hướng của ảnh, như cạnh và đường Điều này xảy ra do không có sự liên kết giữa chiều dọc và chiều ngang khi năng lượng của các đặc điểm này vượt quá các băng con.
Biến đổi wavelet thẳng đơn giản gồm hai biến đổi đôi wavelet một chiều (1D
Here is the rewritten paragraph:Quá trình lấy mẫu theo chiều dọc và chiều ngang được thực hiện bằng cách lấy mẫu theo cột trước rồi theo hàng Sau đó, quá trình này được lặp lại trong ảnh biến đổi Cần lưu ý rằng mỗi lần dịch bộ lấy mẫu con trong quá trình phân tách là một lần biến đổi dư thừa Tuy nhiên, biến đổi định hướng vẫn tách rời và cho phép biến đổi theo nhiều hướng hơn, mang lại kết quả phong phú hơn.
Bước đầu tiên trong việc xác định các hướng trong không gian rời rạc là hiểu rõ định nghĩa về đường rời rạc, được xác định bởi độ dốc và dịch chuyển theo phương trình cụ thể.
Biểu diễn độ dốc nằm trong khoảng [0,1], với B là thông số dịch thực Định nghĩa này đảm bảo mọi pixel thuộc một dòng có độ dốc xác định Dòng có độ dốc ngoài khoảng có thể xác định qua đối xứng hoặc xoay không gian, cho phép truy cập vô hướng.
Chúng ta có khả năng lựa chọn tự do bất kỳ hướng số nào thông qua phương trình đã nêu và áp dụng biến đổi wavelet 1D (hoặc bất kỳ loại biến đổi 1 chiều nào khác) theo hướng đã chọn.
Quá trình biến đổi wavelet có thể lặp lại, cho phép lựa chọn hướng mới tại mỗi lần lặp Biến đổi wavelet 1 chiều tạo ra 2 băng con, trong đó băng thông cao không chứa thông tin chi tiết của đối tượng Sau đó, quá trình này có thể được thực hiện lại trên 1 hoặc cả 2 băng con với một hướng khác Việc lặp lại nhiều lần sẽ tạo ra đa phân giải theo nhiều hướng khác nhau Lưu ý rằng theo biến đổi 1D đã chọn và loại lặp, tín hiệu có thể chứa một lượng lớn biên độ định hướng từ biến đổi trực giao hoặc song trực giao đến khung.
Khái niệm lifting
Biến đổi lifting được thực hiện qua 2 khâu: Predict và Update Giả sử, có tín hiệu
1 chiều a0 Biến đổi lifting được thực hiện qua các bước sau:
1 Chia a0 vào mẫu Even-1 và mẫu Odd-1
Các bước để xây dựng biến đổi đa mức được thực hiện lặp đi lặp lại, bắt đầu từ biến đổi ngược đơn giản bằng cách đảo ngược hệ thống và thay đổi dấu kết hợp Các chuỗi chẵn và lẻ kết hợp với nhau nhằm khôi phục tín hiệu gốc Hình 3.2 minh họa biến đổi thuận, trong đó các hệ số a thể hiện giá trị trung bình và các hệ số d phản ánh sự khác biệt trong tín hiệu Hai tâm tương ứng với tần số băng thấp và băng cao của tín hiệu Đối với biến đổi wavelet Haar, cần thực hiện các bước cụ thể để đạt được kết quả mong muốn.
Biến đổi Haar là một phương pháp đơn giản và dễ thực hiện trong xử lý tín hiệu, có khả năng hoạt động hiệu quả cả trong miền thời gian và miền tần số Tuy nhiên, kết quả của biến đổi Haar thường không đạt chất lượng cao do bước dự đoán cơ bản Tất cả các biến đổi wavelet đều có thể được trình bày thông qua các bước lifting, điều này cho thấy tính linh hoạt và ứng dụng rộng rãi của chúng trong phân tích tín hiệu.
47 số biến đổi hiệu quả hơn như Daubechies hay song trực giao đối xứng đã được áp dụng
Hình 3-2 Mô hình biến đổi lifting thu n ậ
Quá trình nén dữ liệu bao gồm hai bước chính: giải tương quan và mã hoá Đầu tiên, giải tương quan tạo ra không gian dữ liệu ảnh nhưng không giúp nén dữ liệu Do đó, bước nén phải được thực hiện sau mỗi bước nâng để giảm kích thước dữ liệu hiệu quả Trong bước mã hoá, các bộ mã hoá entropy như mã hoá Huffman hoặc mã hoá số học được sử dụng để tối ưu hóa quá trình nén.
Hình 3-3 Bước dự đoán và Update trong Lifting
Lý thuyết và thuật toán
Thuật toán của cấu trúc Lifting thông thường như sau:
Thuật toán thuận for j = -1 to n –
*/ cho j có giá trị từ 1 đến - -n for each position k in a j+1
*/ với mỗi vị trí k trong aj+1, tính:
(a j,k , d j,k } = split(a j+1,k ) dj,k -= predict( aj,k) a j,k += update(d j,k )
Thuật toán nâng ngược for j = -n to -1 for each position k in a j+1 a j,k -= update( d j,k ) d j,k += predict( a j,k ) a j+1,k = merge(a j,k , d j,k } trong đó các hàm predict() và update() được xác định như trên
Số các mẫu có thể giảm bằng lấy mẫu con đơn giản từ tín hiệu đầu vào:
, với là mẫu chẵn (2k) tại mức (0) của biến đổi và là mẫu ở mức tiếp theo (1) Thông thường, các mẫu khác được phân chia như sau:
Trong đó là sự khác biệt hay là hệ số wavelet.
Như đã đề cập ở phần trước, chúng ta tìm kiếm một cách biểu diễn gọn hơn cho a 0,k
Khi loại bỏ các giá trị không chứa thông tin trong tín hiệu, chúng ta chỉ giữ lại a-1,k, từ đó tạo ra một biểu diễn gọn gàng hơn mà vẫn có thể khôi phục lại a0,k Tuy nhiên, tín hiệu thực tế lại không đơn giản như vậy.
Trong trường hợp thực hiện bước dự đoán nhằm tìm các mẫu lẻ từ các mẫu chẵn, bước này được xây dựng dựa trên sự tương quan của tín hiệu tại mức 0 Việc áp dụng hàm dự đoán P sẽ giúp cải thiện độ chính xác trong quá trình phân tích dữ liệu.
Chúng ta có thể thay thế dữ liệu gốc bằng một tập dữ liệu khác, cho phép dự đoán và tái tạo các mẫu bị lỗi Tuy nhiên, việc tái tạo chính xác hoặc dự đoán từ dữ liệu gốc vẫn gặp khó khăn Chúng ta có thể thay thế giá trị chênh lệch giữa dữ liệu gốc và giá trị dự đoán P(d -1,k) Khi hai giá trị này tương đương, sự khác biệt sẽ nhỏ hơn giá trị gốc Do đó, chúng ta có thể tính toán được kết quả một cách hiệu quả.
Nếu tín hiệu tương quan và phù hợp với mô hình thì hầu hết các hệ số wavelet đều nhỏ
Để khai thác hiệu quả sự dư thừa dữ liệu, cần thiết lập các tập hợp a-1,k và d-1,k nhằm đạt được mức tương quan tối ưu Việc chia thành các mẫu chẵn và lẻ trong bước chia (split) giúp tận dụng lợi thế không gian thời gian, thay vì chỉ chia tín hiệu thành hai nửa trái phải.
Có thể dự đoán mẫu lẻ bằng giá trị trung bình của các mẫu chẵn quanh nó ở mức trước và Do đó, chúng ta có hàm dự đoán
Cơ chế dự đoán này dựa trên việc lấy mẫu tín hiệu qua các khoảng dài 2 từ một hàm tuyến tính liên tục Khi tín hiệu phù hợp với mô hình, các hệ số wavelet sẽ có giá trị nhỏ hơn so với những tín hiệu không khớp.
Sau khi áp dụng quy trình này, chúng ta tạo ra hai tập hợp mới Chúng ta có thể lặp lại bước này để thu được các tập hợp khác từ những tập hợp ban đầu Từ mức j, quá trình này tiếp tục diễn ra.
50 chúng ta chuyển lên mức tiếp theo bằng cách chia tín hiệu vào các giá trị và từ
Cuối cùng, tín hiệu gốc được thay thế bằng tập hợp { } sau bước/mức, dẫn đến việc tín hiệu gốc được thay thế bởi một hệ số băng thấp và một số hệ số băng cao Nếu tín hiệu phù hợp với mô hình, chúng ta hy vọng rằng các thành phần trong tập hợp này sẽ có biên độ nhỏ hơn.
Hình 3-4 Tính toán các h s wavelet trong Lifting ệ ố
Tại mỗi tỷ lệ, cần duy trì các hệ số ổn định và sử dụng thông tin này để xác định các hệ số cần thiết nhằm cập nhật các hệ số Các hệ số này được gọi là hệ số lifting Để tìm ra các giá trị này, chúng ta sẽ áp dụng một thuật toán cụ thể.
Với mỗi , xác định hệ số để dự đoán
Cập nhật các moment cho tất cả các giá trị ở mức đang xét theo phương trình sau: với chỉ số của hệ số, h là lệ ố tương ứng ( , là moment được cập nhật ( và là chỉ số của hệ số.
Để đảm bảo các moment bằng 0 ở tất cả các mức, chúng ta cần xây dựng một hệ thống tuyến tính nhằm tìm các hệ số nâng cho các giá trị Các bước thực hiện bao gồm: đầu tiên, đặt giá trị của một biến bất kỳ bằng 1 và tất cả các giá trị khác bằng 0 Sau đó, áp dụng biến đổi ngược để xác định cách chia các hệ số này vào các hệ số khác và tạo ra hệ thống tuyến tính cho các biến.
Hệ số lifting là một yếu tố quan trọng trong việc xác định moment thứ i, liên quan đến chỉ số tại mức đang xét Nó là thành phần cốt lõi trong ma trận moment và có ảnh hưởng đáng kể đến kết quả phân tích Cần lưu ý rằng giá trị của hệ số lifting có thể thay đổi từ 1 đến đội dài của tín hiệu Hệ thống này giúp tổng hợp các hệ số lifting từ nhiều nguồn khác nhau.
Với ở mỗi mức, thực hiện quỏ trỡnh như trờn để tại cỏc hệ số lifting ẹ.
Biến đổi Wavelet trong xử lý nén ảnh
Biến đổi Wavelet Haar là một trong những phương pháp cơ bản nhất trong lĩnh vực xử lý ảnh Nó có khả năng tạo ra các hình ảnh như ba bức đầu tiên trong hình 3.1, dẫn đến bức ảnh hoàn thiện của Rosa Parks Hình ảnh này được tách ra từ một file ảnh gif tải về từ World Wide Web Để thực hiện các tính toán và tái tạo hình ảnh, phần mềm Matlab là công cụ hữu ích, cho phép hiển thị tất cả các bức ảnh theo dạng này.
Mỗi bức ảnh số trong hình 3.1 được biểu diễn toán học bằng một ma trận kích thước 128x128, trong đó các giá trị số nằm trong một dải xác định.
0 (đại diện cho màu đen) đến một số dương toàn bộ (đại diện cho màu trắng)
Bức ảnh cuối cùng được gọi là ảnh 5 bit, sử dụng 32 mức độ bóng khác nhau của màu xám Ma trận đặc biệt đã biểu diễn ảnh này trong dải từ 0 đến 1984, với 31 bước tăng của 64.
53 những con số chính xác không quan trọng, chúng được chọn sao cho tránh các phần lẻ dư ra trong các phép tính toán sau đó)
Mỗi ma trận tạo ra các ô vuông nhỏ được làm bóng với mức xám không đổi dựa trên giá trị số học của chúng Những ô vuông này được gọi là điểm ảnh (hay pixel), và khi phóng to bức ảnh, chúng trở nên rõ ràng hơn như các ô vuông riêng lẻ, như thể hiện trong hình 3.2a.
Hình ảnh 8-bit với độ phân giải 256x256 pixel, như bức chân dung của Nelson Mandela trong hình 3.2b, cho thấy rõ nét các chi tiết và màu sắc đặc trưng của phong cách nghệ thuật này.
(illusion) của một bức ảnh được làm bóng một cách liên tục.
Hình 3-5 Rosa Parks (1955) và Nelson Mandela (1990)
Các ma trận xác định ảnh có kích thước 128x384 và 256x356 cho thấy vấn đề lưu trữ trung gian Ảnh màu còn lớn hơn, nhưng có thể được xử lý bằng cách giải nén trong 3 mảng “grayscale-like”, với mỗi mảng tương ứng với màu đỏ, xanh lá cây và xanh dương.
Một cơ chế được mô tả cho việc biến đổi dữ liệu là khả năng lưu trữ và truyền tải hiệu quả các mảng số lớn Sau đó, các ảnh gốc hoặc các phiên bản gần đúng của chúng có thể được khôi phục bằng máy tính một cách hiệu quả Cụ thể, có thể xem xét một ảnh 8x8 pixel, trong đó một vùng 6 ảnh nhỏ xung quanh mũi được trích xuất từ hình ảnh gốc Vùng ảnh được lấy ra được đánh dấu rõ ràng.
Hình 3-6 Rosa Parks – Trích dẫn m t vùng nh nh nghiên c uộ ả ỏ để ứ
Hình ảnh này được biểu diễn bởi các dòng từ 60 đến 67 và các cột từ 105 đến
112 trong ma trận được xác định trong hình 3 Bây giờ ta có thể hiển thị và đặt tên 5 cho ma trận con này là ma trận P:
Trong hình 3.6b, trải căng ra (contrast stretched) được sử dụng để làm nổi bật các biến tinh tế giữa nhiều điểm thay đổi, như các giá trị nhỏ nhất và lớn nhất của ma trận, cụ thể là 448 và 1600, tương ứng với màu đen và trắng, mà không thể thấy trong hình 3.5a Để giải thích cách biến đổi Wavelet áp dụng cho sự biến đổi này, chúng ta sẽ bắt đầu bằng việc mô tả phương pháp lấy trung bình (averaging) và tính vi phân (differencing) cho các chuỗi dữ liệu.
Chúng ta sẽ áp dụng kỹ thuật biến đổi ma trận bằng cách xem mỗi dòng như một chuỗi, sau đó tính trung bình và vi phân cho từng thành phần để tạo ra một ma trận mới Tiếp theo, chúng ta sẽ lặp lại quy trình tương tự đối với các cột để thu được một ma trận đã được biến đổi Kết quả cuối cùng là một ma trận đã được cải tiến cả về dòng và cột.
Ví dụ về ma trận P, bảng dưới đây trình bày các dòng liên tiếp thể hiện kết quả qua các bước biến đổi ban đầu, trung gian và cuối cùng.
B ng 3-1 Kả ết quả 3 bước biến đổi Wavelet tương ứng
Có 3 bước trong quá trình biến đổi vì chuỗi dữ liệu có độ dài 8=2 3 Dòng đầu tiên của bảng là chuỗi dữ liệu gốc (lấy dòng đầu tiên của ma trận P), trong đó có thể coi như 4 cặp số Bốn số đầu tiên trong dòng thứ 2 lần lượt là trung bình cộng của 4 cặp số trên Tương tự, 2 số đầu tiên của dòng thứ 3 lần lượt là trung bình cộng của 2 bộ 4 số dòng đầu tiên Số đầu tiên dòng thứ 4 là trung bình cộng của cả 8 số trong dòng đầu
Các số in đậm trong bảng thể hiện độ sai khác của giá trị trung bình Bốn giá trị in đậm ở dòng thứ hai tương ứng với hiệu của bốn giá trị trung bình đầu tiên so với bốn thành phần đầu tiên trong mỗi cặp số, cụ thể là hiệu của 640, 1216, 1408, 1536 với 576, 1152, 1344, 1536, cho kết quả là -64, -64, -64, 0 Những kết quả này được gọi là các hệ số chi tiết (detail coefficients) và được lặp lại trong các dòng tiếp theo của bảng.
Trong bảng, số thứ 3 và thứ 4 của dòng 3 thể hiện hiệu giữa các cặp số 928, 1472 với 640, 1408, cho kết quả lần lượt là -288 và -64 Hai hệ số này được lặp lại ở dòng cuối cùng của bảng Đặc biệt, số thứ 2 trong dòng cuối cùng (-272) là hệ số chi tiết, tương ứng với hiệu giữa 1200 và 928.
Kết quả cuối cùng là một ma trận T 8x8 mới, gọi là ma trận biến đổi Wavelet Haar:
Ma trận này có một giá trị đại diện cho giá trị trung bình tổng cộng ở góc trên bên trái, cùng với 63 hệ số chi tiết Biến đổi Wavelet cho thấy các vùng ít thay đổi trong dữ liệu gốc được biểu diễn bằng các giá trị nhỏ hoặc gần bằng 0 Các giá trị 0 trong ma trận T xuất hiện do sự hiện diện của các hệ số liền kề giống nhau trong ma trận gốc P, trong khi các giá trị -2, -4 và 4 trong T là kết quả của các hệ số liền kề gần giống nhau trong ma trận P.
Một ma trận có tỉ lệ các hệ số bằng 0 lớn được gọi là ma trận có độ dự trữ (sparse) Biến đổi Wavelet của ảnh thường tạo ra các ma trận có độ dự trữ cao hơn so với ảnh gốc, giúp việc lưu trữ và truyền tin trở nên dễ dàng hơn Các ma trận dự trữ cho phép đặc biệt hóa các vùng dữ liệu và các vùng có giá trị 0, ví dụ, mô tả một ma trận 100x100 chỉ cần nêu rõ các vị trí có giá trị khác 0, như "ma trận này có giá trị 7 tại vị trí (2,2) và (6,8)", thay vì liệt kê tất cả 10,000 hệ số của ma trận.
Biến đổi wavelet dựa trên cơ chế lifting
Lifting là phương pháp thiết kế biến đổi wavelet sử dụng một chuỗi bộ lọc, được gọi là bước lifting Trong quá trình này, tín hiệu ban đầu được chia thành các mẫu chẵn và lẻ Các mẫu lẻ được dự đoán từ các mẫu chẵn, và phần dư thừa trong quá trình dự đoán sẽ được dùng để bổ sung cho các mẫu chẵn.
Các bộ lọc trong quá trình dự đoán và bổ sung, được gọi là bộ lọc phân tích và tổng hợp của DWT, có khả năng liên kết cho đến khi nhận được tín hiệu băng thấp và băng cao cuối cùng của biến đổi Cơ chế này luôn khả nghịch ở tất cả các mức Hình 3.10 b minh họa biến đổi ngược, cho thấy rằng việc kiểm tra chặt chẽ các bộ lọc cho phép dự đoán tất cả các mẫu lẻ từ giá trị trung bình và mở rộng.
Hai pixel chẵn lân cận được bổ sung từ giá trị trung bình và mở rộng của hai pixel lẻ lân cận trong quá trình dư thừa dự đoán.
Biến đổi wavelet ADL
Sự khác biệt chính giữa lifting thông thường và ADL nằm ở khả năng dự đoán Trong khi lifting thông thường thực hiện dự đoán theo chiều dọc hoặc ngang, ADL lại áp dụng phương pháp phân tích đa chiều để cải thiện độ chính xác trong dự đoán.
63 mỗi tương quan về không gian trong vùng khảo sát theo tất cả các hướng, sau đó thực hiện dự đoán theo hướng có lỗi dự đoán thấp nhất
Giả ử s tín hi u hai chi u ệ ề v i ớ bằng cách sử dụng biễu đổi wavelet một chiều để tách tín hiệu thành các băng tần cao và thấp theo hướng dọc và ngang Biến đổi wavelet một chiều trở thành một bước quan trọng trong quy trình lifting.
Như phần trước đã trình bày, khâu lifting đặc trưng gồm 3 bước: chia, d ự đoán và update
Tất cả các mẫu được chia thành 2 ph n: các m u ch n ầ ẫ ẵ và l ẻ :
Trong quá trình dự đoán, các mẫu lẻ tại vị trí nguyên sẽ được xác định dựa trên các mẫu chẵn lân cận Để tính toán dự đoán dư thừa hoặc các hệ số băng con cao, các phương pháp cụ thể sẽ được áp dụng.
Dự đoán giá trị được thực hiện thông qua sự kết hợp tuyến tính của các hệ số chẵn lân cận, tạo thành mối tương quan chặt chẽ Như thể hiện trong Hình 1, các pixel có mối tương quan gần gũi được đánh dấu, trong đó pixel nguyên là “ ”, pixel một chiều là “+” và pixel phần tư là “x” Dự đoán được xác định bởi các mẫu chẵn được chỉ dẫn theo hướng mũi tên trong Hình 1.
; Trọng s ố cho bởi bộ ọc l
Lưu ý, không cần ph i l y m u ả ấ ẫ t i các v trí ạ ị nguyên
Hàm đáp ứng xung h u hữ ạn tương quan trong miền là
Chỉ số a và b xác định sự giới hạn của hàm chuyển đổi wavelet FIR Do đó, bước dự đoán vẫn được tính toán từ các mẫu chẵn, và ADL hoàn toàn có thể khôi phục chính xác các mẫu lẻ theo công thức (3.2).
Trong bước update, các mẫu even được thay th b i công thế ở ức:
Hình 3-11 Bước dự đoán và update theo góc dọc trong biến đổi ADL a Bước dự đoán b Bước update
Lưu ý rằng luôn giữ nguyên vị trí góc Bước cập nhật trong cơ chế ADL áp dụng với giá trị góc như trong bước dự đoán Chúng ta kết hợp dự đoán và cập nhật với cùng một giá trị góc để cải thiện thông tin trong quá trình mã hóa Thực tế cho thấy việc sử dụng giá trị góc trong bước cập nhật bằng giá trị trong bước dự đoán là tối ưu nhất cho việc giảm thiểu các biến dạng ảnh Thông thường, trong bước cập nhật của ADL, các mẫu được dự đoán như sau:
Trọng s ố được cho b i b l c; ở ộ ọ có th không ể ph i là h s thông cao nguyên do giá tr ả ệ ố ị Hàm đáp ứng xung h u hữ ạn tương quan trong mi n ề là
Chỉ số và xác định giới hạn hình thức của bộ lọc wavelet FIR là rất quan trọng Khâu biên đổi ngược khá đơn giản, cho phép khôi phục chính xác các mẫu chẵn Để khôi phục tín hiệu hai chiều một cách chính xác, chúng ta cần đặt các mẫu dự đoán và cập nhật tại những vị trí nguyên như đã chỉ ra trong (3.2) và (3.5).
Các hàm FIR c a Haar m r ng, b lủ ở ộ ộ ọc 5/3 và 9/7 được cho tương ứng như sau:
Có th ể coi Lifting thông thường là một trường hợp đặc biệt của Lifting ADL với
Biến đổi wavelet ADL theo phương ngang chạy theo chiều dọc và theo chiều ngang có thể tối ưu hóa hướng dự đoán trong phân tích lifting Góc dự đoán của biến đổi phương ngang không yêu cầu cấu trúc giao nhau với phương dọc, cho thấy sự linh hoạt trong ứng dụng của biến đổi ADL Khi biến đổi wavelet 1D được coi là một thành phần quan trọng trong khâu lifting, việc dự đoán không gian có thể ảnh hưởng đến khâu chia băng con nếu được thực hiện đúng cách.
, bước phân tích lifting trư c ớ đã xoá tương quan về hướng
Biến đổi wavelet ADL hai chiều có khả năng phân tích hình ảnh thành nhiều mức độ khác nhau, tương tự như biến đổi 2D DWT thông thường Mặc dù không sử dụng kỹ thuật lifting theo hướng ngang hoặc dọc, biến đổi này vẫn có thể tạo ra các cấu trúc băng con tương tự như biến đổi wavelet 2D truyền thống Điều này là nhờ vào cách mà biến đổi wavelet ADL chia các băng con thấp và cao theo cả hai hướng, giống như cách thực hiện của biến đổi wavelet thông thường, tạo ra các băng con LL, LH, HL và HH trong cùng một mức phân tích Để hiểu rõ hơn về hiệu quả của biến đổi wavelet ADL hai chiều, ta có thể tham khảo Hình 2, trong đó băng con của ảnh đạt được từ phân tích ADL.
HL chỉ có một dòng c dọc đầu tiên sau biến đổi dọc mang năng lượng đáng kể Dự đoán hướng tương thích giúp xoá thành công dư thừa thống kê trong tất cả các hướng khác, được biểu diễn thông qua các dự đoán nhỏ ở ba hàng cuối của băng con HL.
HH mang nhiều mẫu chữ ẫ ẵn có năng lượng nh và không mang thông tin nh n biỏ ậ ết c u trúc tín hi u, sau khi biấ ệ ến đổi thông thường theo hướng ngang và dọc.
Hình 3-12 nh g c (a) và nh k t qu Ả ố ả ế ả sau băng con LL (b), LH (c), HL (d), HH (e)
Hình 3-13 Phân vùng ảnh Barbara và hướng trong m i block ỗ
Trong băng con LH, có sự xuất hiện của một số cấu trúc đường chéo tại mức cao và tần số thấp, do quá trình giảm độ phân giải không gian trong bước biến đổi ADL Điều này làm cho việc dự đoán hướng chính xác trở nên khó khăn Tuy nhiên, năng lượng tín hiệu vẫn được chuyển vào băng con LH thấp hơn trong cơ chế lifting thông thường Để hiểu rõ hơn về ưu điểm của biến đổi ADL, chúng ta cần tham khảo Hình 3.13.
Hình 3-14 So sánh nh x ả ử lý theo JPEG2000 và biến đổi ADL 2D 1 m c ứ
3.7.1 Nội suy pixel con Để dự đoán hướng theo góc b t kấ ỳ, cơ chế ADL c n các giá tr v ầ ị ề cường độ t i t ng v trí pixel thành ph n Nói cách khác, giá tr ạ ừ ị ầ ị dùng trong công th c ứ
(3) and (6) không nh t thiêt ph i là s nguyên ấ ả ố Do đó, nội suy các pixel con tr ở thành m t vộ ấn đề
Để khôi phục hoàn toàn hình ảnh, các pixel nguyên gốc được sử dụng để nội suy pixel fraction ở phía phải là các mẫu không tham gia vào bước dự đoán Biểu thức nội suy được áp dụng trong trường hợp này là rất quan trọng để đảm bảo độ chính xác và chất lượng của hình ảnh sau khi xử lý.
(3.11) bi u di n các giá tr nguyên quanh ể ễ ị và là thông s lố ọc n i suy Áp d ng (3) và biộ ụ ến đổi trong (11), ta có:
Kỹ thuật nội suy Sinc thường được áp dụng để thực hiện nội suy cho các tín hiệu Một thách thức trong quá trình này là thiết kế bộ lọc tối ưu cho nội suy pixel con Khi mở rộng bộ lọc nội suy cho các bộ lọc FIR khác, có thể thiết kế một bộ lọc nhằm giảm thiểu năng lượng băng con cao một cách hiệu quả.
Băng con Biến đổi Ảnh
Barbara Ảnh xe đạp Ảnh cafe Ảnh Foreman
B ng 3-2 Gả iá trị ệ ố trung bình trong băng h s con LH, HL và HH
Việc tối ưu có thể giải quyết bằng phương thức bình phương tối thiểu
Các hệ số lọc … đượ ối ưu cho ảnh đầc t u vào Trước đây, các h s tệ ố ối ưu phải gửi như thông tin phụ
Biến đổ i Wavelet 2- D dựa trên cơ chế Lifting kết hợp dự đoán định hướng (2D -dir- DWT) 72
Sau đây sẽ trình bày cách áp dựng biến đổi 2D DWT thẳng cho tín hiệu 2D sử dụng cơ chế lifting
Liên kết biến đổi 1D DWT sử dụng cơ chế lifting theo chiều dọc và ngang, với việc dự đoán định hướng thông minh cho các pixel Các pixel không nhất thiết phải theo chiều dọc hoặc ngang như trong biến đổi 2D DWT Hình 3.16 a thể hiện một số lựa chọn dự đoán pixel trong hàng lẻ, sử dụng phân đoạn pixel hoặc pixel hoàn chỉnh từ hàng chẵn Bước bổ sung thực hiện bằng cách sử dụng dư thừa dự đoán từ hàng lẻ theo cùng hướng Sau khi lấy mẫu theo chiều dọc cho tín hiệu băng thấp và cao, các bước dự đoán và bổ sung được áp dụng theo chiều ngang, độc lập với tín hiệu băng thấp và cao (Hình 3.16 b) Tín hiệu băng thấp có thể được biến đổi lại bằng hệ lifting định hướng để đạt được phân tách băng con định hướng đa mức.
Có nhiều phương pháp để dự đoán định hướng, cho phép chúng ta dự đoán hoặc bổ sung pixel từ bất kỳ pixel nào trong hàng chẵn hoặc lẻ Tuy nhiên, việc sử dụng các pixel lân cận sẽ mang lại hiệu quả dự đoán tốt hơn Các phương pháp lifting có thể được thực hiện theo chiều ngang hoặc chiều dọc để tối ưu hóa kết quả dự đoán.
Biến đổi Wavelet 1 D dựa trên cơ chế lifting kết hợp dự đoán dư thừa(1D - -dir-DWT)
Biến đổi 1D DWT sử dụng cơ chế lifting kết hợp với dự đoán định hướng thông qua các bước lifting theo hướng dọc, nhằm tối ưu hóa quá trình xử lý tín hiệu.
Cặp dự đoán và biến đổi chỉ được thực hiện một lần theo hướng dọc hoặc ngang, nghĩa là nếu đã thực hiện theo hướng ngang thì không thực hiện theo hướng dọc và ngược lại Biến đổi DWT 1-D định hướng cho dư thừa dự đoán có hiệu quả tốt hơn so với DWT 2-D định hướng, vì các đặc tính của dư thừa dự đoán chặt chẽ hơn với các hàm cơ bản của DWT 1-D Năng lượng của dư thừa dự đoán chủ yếu tập trung dọc theo cạnh và biên của đối tượng có dạng 1 hướng, cho thấy rằng biến đổi với các hàm cơ bản hỗ trợ cấu trúc 1 hướng có thể thực hiện tốt hơn.
Mặc dù biến đổi 1D định hướng nâng cao chất lượng nén dư thừa dự đoán, biến đổi 2D vẫn được ưa chuộng nhờ hiệu quả tốt hơn ở một số khu vực Do đó, việc kết hợp cả hai loại biến đổi trong quá trình sử dụng là cần thiết, tức là áp dụng biến đổi phù hợp với từng block cơ bản.
Mô phỏng và thực nghiệm
Mô phỏng theo thuật toán đề xuất
Trước hết, sử dụng đầu vào là ảnh Barbara với kích thước 512x512 pixel
Hình 4-1 nh gẢ ốc ban đầu
76 Hình 4-2 K t qu sau khi biế ả ến đổi Wavelet 1 chi u theo hàng ề
Hình 4-3 Kết quả sau khi biến đổi Wavelet 2 chi u 1 m c ề ứ
Hình 4-4 Kết quả sau khi biến đổi Wavelet 2 chi u 2 m c ề ứ
Hình 4-5 nh sau khi biẢ ến đổi wavelet dựa trên cơ chế lifting 1 m c ứ
Hình 4-6 nh sau khi biẢ ến đổi wavelet dựa trên cơ chế lifting 2 m c ứ
Kết quả so sánh MSE và PSNR:
Biến đổi DWT-2D Liing DWT
B ng 4-1 So sánh k t qu giả ế ả ữa biến đổi DWT-2D và Lifting DWT
Nhận xét kết quả mô phỏng đã thu được
Theo kết quả thu được, bài toán mô phỏng đã được giải quyết thành công Ảnh sau khi áp dụng biến đổi Wavelet Haar cho thấy ảnh trung bình ở góc trên bên trái, kèm theo các chi tiết ảnh tương ứng (như hình 4.3).
PSNR càng nhỏ do các hệ số chi tiết giảm Tuy nhiên, với biến đổi Lifting DWT hệ số này được cải thiện lên khác nhiều.
Một số kết quả nghiên cứu thực nghiệm
Một số kết quả thí nghiệm thực tế sẽ so sánh các biến đổi trong MC-residuals và RE-residuals Thí nghiệm được thực hiện với 10 chuỗi video có độ phân giải CIF, trong đó mỗi chuỗi được chọn một ảnh để tính dư thừa bù chuyển động ảnh.
The article discusses the use of 8x8 blocks and evaluates quarter pixel motion estimation alongside enhanced resolution interpolation derived from QCIF resolution, utilizing methods from H.264/AVC reference software Notably, it compresses 20 (x2) redundant images based on specific transformations.
- Biến đổi 2D DWT thẳng (2D sep- -DWT)
- Biến đổi D 2 DWT định hướng (2D-dir-DWTs)
- Biến đổi 1D DWT định hướng kết hợp 2D DWT thẳng (1D-dir-DWTs + 2D- sep-DWT)
Chọn biến đổi tối ưu cho từng vùng 8x8 pixel nhằm tối ưu hóa tỷ lệ biến dạng bằng cách tối thiểu hóa hàm Lagrangian với giá trị MSE và số hệ số biến đổi không xác định cho mỗi loại dự đoán Sử dụng bộ lọc wavelet song trực giao 9/7 để thực hiện quá trình này Hiệu quả nén được đánh giá thông qua các tham số PSNR và số hệ số biến đổi khác không (NONTC) đạt được sau ngưỡng Khi không thực hiện mã hóa entropy, tốc độ bit (bitrate) không phải là yếu tố cần quan tâm.
Thông tin về loại biến đổi sử dụng cho từng vùng là cần thiết, với 2D-dir-DWTs yêu cầu 81 biến đổi cho mỗi block, trong khi 1D-dir-DWTs kết hợp với 2D-sep-DWT chỉ cần 20 biến đổi Việc giảm số lựa chọn có thể làm giảm tốc độ bit sử dụng cho thông tin phụ, nhưng 2D-sep-DWT không cần truyền thông tin này.
Để tổng hợp kết quả so sánh tại các tỷ lệ nén khác nhau, chúng ta áp dụng các chỉ số tiết kiệm hệ số và Bjontegaard-Delta PSNR (BD-PSNR) Các thước đo này phản ánh phần trăm tiết kiệm trung bình và PSNR trung bình giữa hai đường cong PSNR-NONTC Mỗi đường cong được tạo ra từ hai điểm dữ liệu PSNR-NON
Hình 4 và 5 trình bày kết quả thí nghiệm về phần trăm tiết kiệm hệ số của các biến đổi DWT Cụ thể, Hình 4 so sánh 2D-dir-DWTs với 2D-sep-DWT trong trường hợp MC-residuals và RE-residuals, trong khi Hình 5 thể hiện sự tiết kiệm hệ số của 1D-dir-DWTs kết hợp với 2D-sep-DWT so với 2D-sep-DWT trong cùng các trường hợp MC-residuals và RE-residuals.
Biến đổi 1D-dir-DWTs kết hợp với 2D-sep-DWT cho hiệu quả nén tốt hơn so với biến đổi 2D-dir-DWTs, với 20 trường hợp nghiên cứu cho thấy kết quả vượt trội Trung bình, biến đổi 2D-dir-DWTs yêu cầu ít hơn 5% hệ số so với 2D-sep-DWT đối với MC residuals Trong khi đó, sự kết hợp giữa 1D-dir-DWTs và 2D-sep-DWT cần ít hơn 21% hệ số so với 2D-sep-DWT Đối với RE-residuals, tiết kiệm được 2% với 2D-dir-DWTs và 15% với sự kết hợp của 1D-dir-DWTs và 2D-sep-DWT.
81 b RE residual- Hình 4-7 Mức tiết kiệm h s c a 2D-dir-DWT so vệ ố ủ ới 2D-sep-DWT a MC-residual b RE residual-Hình 4-8 Mức tiết kiệm h s c a 1D-dir-DWT+2D-ệ ố ủ sep-DWT so với 2D-sep-DWT
Kết quả so sánh cho thấy biến đổi 2D-dir-DWTs nâng cao giá trị trung bình PSNR thêm 0.10 dB so với biến đổi 2D-sep-DWT áp dụng cho MC-residuals Trong khi đó, biến đổi 1D-dir-DWTs kết hợp với 2D-sep-DWT mang lại giá trị trung bình PSNR cao hơn 0.33 dB so với 2D-sep-DWT Đối với dư thừa RE-residuals, biến đổi 2D-dir-DWTs có giá trị trung bình PSNR là 0.05 dB, trong khi biến đổi kết hợp 1D-dir-DWTs và 2D-sep-DWT đạt 0.53 dB.
Kết quả nghiên cứu cho thấy việc kết hợp biến đổi wavelet định hướng 1 chiều với biến đổi wavelet riêng biệt 2 chiều mang lại hiệu quả nén dự đoán dư thừa tốt hơn so với việc chỉ sử dụng biến đổi wavelet định hướng 2 chiều hoặc biến đổi wavelet riêng biệt 2 chiều.
Tổng kết
Trong nén ảnh, các biến đổi thường được áp dụng để khai thác dư thừa dự đoán Tuy nhiên, cần lưu ý rằng dư thừa dự đoán có những đặc điểm riêng biệt so với ảnh.
Việc phát triển các biến đổi wavelet định hướng tương thích với dư thừa dự đoán mang lại hiệu quả cao hơn trong nén ảnh Luận văn này tập trung vào biến đổi wavelet định hướng một chiều cho nén dư thừa dự đoán Qua các thí nghiệm sơ bộ, kết quả cho thấy biến đổi định hướng một chiều kết hợp với biến đổi wavelet riêng biệt hai chiều đạt hiệu quả nén tốt hơn so với biến đổi định hướng hai chiều hoặc biến đổi riêng biệt hai chiều.
Chương 5 Kết luận và đề xuất hướng nghiên cứu tiếp theo
5.1 Những kết luận chính của luận văn
Với đề tài luận văn tốt nghiệp "Nghiên cứu phân tích xử lý ảnh bằng phương pháp Wavelet định hướng", tôi đã xác định và hoàn thành các mục tiêu nghiên cứu quan trọng.
Nghiên cứu về các dạng và đặc điểm của các họ Wavelet khác nhau giúp lựa chọn Wavelet phù hợp cho từng ứng dụng cụ thể Việc này cho phép ứng dụng lý thuyết Wavelet một cách linh hoạt và hiệu quả trong xử lý tín hiệu.
Ứng dụng biến đổi Wavelet định hướng tron nén ảnhg :
Thực hiện được các biến đổi Wavelet đối với ảnh đầu vào, đánh giá hiệu quả xử lý ảnh phục vụ nén ảnh, lưu trữ/truyền tải dữ liệu
Thực hiện biến đổi Wavelet cơ bản và biến đổi Wavelet định hướng với nhiều mức khác nhau nhằm đánh giá hiệu suất của thuật toán.
5.2 Hướng nghiên cứu tiếp theo
Biến đổi Wavelet đang được ứng dụng hiệu quả trong xử lý nén ảnh, nhờ vào những ưu điểm vượt trội của nó Công nghệ này không chỉ có ứng dụng trong nén ảnh mà còn được sử dụng rộng rãi trong lĩnh vực âm thanh, video, khử nhiễu và bảo mật.
Ví dụ là nghiên cứu biến đổi Wavelet trong tín hiệu điện tim ECG (Electrocardiogram), trong tín hiệu điện não đồ EEG (Electroencephalogram) và điện cơ đồ EMG (Electromyorgram)…
Em xin gửi lời cảm ơn chân thành đến PGS.TS Nguyễn Hữu Trung, TS Nguyễn Thuý Anh cùng các thầy cô trong Viện Điện Tử Viễn Thông - trường Đại Học Bách Khoa Hà Nội, vì đã tận tình hướng dẫn và hỗ trợ em trong quá trình học tập và hoàn thành luận văn Sự giúp đỡ quý báu của các thầy cô, anh chị và bạn bè đã góp phần quan trọng vào thành công của em.
Các thuật ngữ viết tắt
2D-sep-DWT : Biến đổi 2D DWT thẳng
2D-dir-DWTs : Biến đổi D DWT định hướng2
: Biến đổi 1D DWT định hướng kết hợp 2D DWT thẳng
NONTC Number of nonzero transform coefſcients
SNR : Signal- -Noise Ratio to
STFT : Short Time Fourier Transform