nang cao chat luong anh va nen anh matlab code

Tài liệu Nâng cao chất lượng ảnh và nén ảnh + Matlab code Chương 1 giới thiệu tổng quan về ảnh số và các kĩ thuật nâng cao chất lượng ảnh như biến đổi ảnh xám, biến đổi âm bản, các phương pháp lọc ảnh nhiễu... Chương 2 giới thiệu về kĩ thuật nén ảnh và đi sâu vào 2 chuẩn nén ảnh JPEG và JPEG2000. Chương 3 giới thiệu tổng quan về ngôn ngữ lập trình Matlab và chương trình mô phỏng kĩ thuật nâng cao chất lượng và nén ảnh bằng Matlab.

Trang 1

MỤC LỤC

MỤC LỤC I DANH MỤC HÌNH VE IV DANH MỤC BẢNG BIỂU VI THUẬT NGỮ VIẾT TĂT VII LỜI NÓI ĐẦU A CHƯƠNG 1 TỔNG QUAN ẢNH SỐ VÀ CÁC KĨ THUẬT NÂNG CAO CHẤT

LƯỢNG ẢNH 1

1.1 TỔNG QUAN VỀ ẢNH SỐ 1

1.2 CÁC KĨ THUẬT NÂNG CAO CHẤT LƯỢNG ẢNH 1

1.2.1 Biến đổi mức xám 1

1.2.1.1 Biến đổi âm bản 2

1.2.1.2 Biến đổi log 2

1.2.1.3 Biến đổi hàm mu 3

1.2.1.4 Giãn độ tương phản 3

1.2.1.5 Kĩ thuật cắt theo mức 4

1.2.2 Cân bằng mức xám 5

1.2.3 So sánh mức xám 6

1.2.4 Chèn nhiễu 6

1.2.5 Lọc ảnh 7

1.2.5.1 Lọc làm mịn ảnh 8

a Lọc không gian tuyến tính 8

b Lọc không gian phi tuyến 8

c Lọc trung bình 8

d Lọc thông thấp miền tần sô 9

1.2.5.2 Lọc sắc nét ảnh 9

a Lọc thông cao 9

b Lọc tần sô từ không gian 10

1.2.5 Các kĩ thuật làm nổi đường biên ảnh 10

1.3 KẾT LUẬN CHƯƠNG 1 11

CHƯƠNG 2 CÁC KĨ THUẬT NÉN ẢNH 12

Trang 2

Đồ án tốt nghiệp đại học Mục lục

2.1 TỔNG QUAN VỀ NÉN ẢNH 12

2.1.1 Giới thiệu chung về nén ảnh sô 12

2.1.2 Sơ đồ khôi hệ thông nén ảnh điển hình 13

2.1.3 Phân loại các kỹ thuật nén 13

2.1.4 Các nguyên tắc khi nén ảnh 14

2.1.5 Dư thừa sô liệu 14

2.1.5.1 Dư thừa mã (Coding Redundancy) 15

2.1.5.2 Dư thừa trong pixel ( Interpixel Redudancy) 16

2.1.5.3 Dư thừa tâm sinh lý (Psychovisual Redudancy) 16

2.1.6 Giới thiệu một sô kỹ thuật sử dụng trong nén ảnh 17

2.1.6.1 Mã hoá dựa trên phép biến đổi DCT 17

a Biến đổi DCT thuận và nghịch 17

b Lượng tử và giải lượng tử 19

c Mã hóa và giải mã 19

2.1.6.2 Kỹ thuật mã hoá băng con 20

a Ý tưởng mã hoá băng con 20

b Mã hoá băng con 20

2.1.6.3 Biến đổi Wavelet trong nén ảnh 22

a Biến đổi Wavelet 1-D 23

b Biến đổi Wavelet rời rạc 2-D 24

2.1.7 Các tiêu chuẩn nén ảnh 26

2.2 GIỚI THIỆU JPEG VÀ JPEG2000 26

2.2.1 JPEG 26

2.2.1.1 Giới thiệu sơ lược 26

2.2.1.2 Sơ đồ khôi 27

2.2.2 JPEG2000 28

2.2.2.1 Giới thiệu sơ lược 28

2.2.2.2 Sơ đồ khôi bộ mã hóa và bộ giải mã JPEG 2000 28

2.2.3 So sánh JPEG và JPEG2000 29

CHƯƠNG 3 CHƯƠNG TRÌNH MÔ PHỎNG 32

3.1 NGÔN NGỮ MATLAB 32

Trang 3

3.1.1 Sơ lược lịch sử Matlab 32

3.1.2 Đặc điểm của Matlab và các ứng dụng 34

3.2 CHƯƠNG TRÌNH MÔ PHỎNG SỬ DỤNG MATLAB 35

3.2.1 Giao diện chương trình mô phỏng 35

3.2.2 Nâng cao chất lượng ảnh 36

3.2.2.1 Biến đổi mức xám 36

a Biến đổi mức xám sử dụng hàm imadjust 37

b Biến đổi âm bản 38

c Biến đổi log 39

d Biến đổi hàm mu 39

e Biến đổi giãn độ tương phản 40

f Kĩ thuật cắt theo mức 41

3.2.2.2 Cân bằng mức xám 41

3.2.2.3 So sánh mức xám 42

3.2.2.4 Chèn nhiễu 43

3.2.2.5 Lọc ảnh 44

a Lọc làm mịn ảnh 45

b Lọc sắc nét ảnh 51

3.2.2.6 Các kĩ thuật làm nổi đường biên ảnh 53

3.2.3 Nén ảnh 54

3.2.3.1 Nén ảnh dùng mã hóa Huffman 54

3.2.3.2 Nén ảnh dùng mã dự đoán không tổn thất 54

3.2.3.3 Nén ảnh JPEG dùng biến đổi DCT 54

3.2.3.4 Nén ảnh JPEG2000 55

KẾT LUẬN 57

TÀI LIỆU THAM KHẢO 58

Trang 4

Đồ án tốt nghiệp đại học Danh mục hình vẽ

DANH MỤC HÌNH VE

Hình 1.1 Biến đổi âm bản 2

Hình 1.2 Đồ thị hàm log 3

Hình 1.3 Đồ thị hàm mu 3

Hình 1.4 Biến đổi giãn độ tương phản 4

Hình 1.5 Đồ thị kĩ thuật cắt theo mức 4

Hình 1.6 Biểu đồ hàm s = T(r) 5

Hình 1.7 Cơ chế lọc không gian 7

Hình 1.8 Đường biên của ảnh 10

Hình 2.1 Sơ đồ khôi một hệ thông nén ảnh điển hình 13

Hình 2.2 Mô hình mã hóa dự đoán không tổn thất bao gồm bộ mã hóa và bộ giải mã 16 Hình 2.3 Sơ đồ mã hóa và giải mã dùng biến đổi DCT 17

Hình 2.4 Các bước của quá trình mã hóa biến đổi DCT đôi với 1 khôi 18

Hình 2.5 a) Băng lọc phân tích; b) Hai bộ lọc thông thấp và thông cao c) Phần vùng trong miền tần sô; d) Băng lọc tổng hợp 21

Hình 2.6 Sơ đồ khôi phân tích tín hiệu mức j 23

Hình 2.7 Sơ đồ biến đổi ngược Wavelet mức j 24

Hình 2.8 Sơ đồ phân tích Wavelet rời rạc 2-D 25

Hình 2.9 Sơ đồ biến đổi ngược Wavelet rời rạc 2-D 25

Hình 2.10 Sơ đồ khôi bộ mã hóa và giải mã JPEG dựa trên biến đổi DCT 27

Hình 2.11 Sơ đồ khôi bộ mã hóa và bộ giải mã JPEG 2000 28

Hình 2.12 So sánh JPEG, JPEG2000 29

Hình 2.13 Tỉ lệ nén của JPEG2000 và JPEG 30

Hình 2.14 Minh hoạ tính năng ROI 31

Hình 3.1 Giao diện chương trình nâng cao chất lượng và nén ảnh 36

Hình 3.2 Giao diện chương trình biến đổi ảnh xám 37

Hình 3.3 Đồ thị của các giá trị trong hàm imadjust 38

Hình 3.4 Ảnh âm bản 39

Hình 3.5 Ảnh biến đổi hàm log 39

Hình 3.6 Ảnh biến đổi hàm mu 40

Trang 5

Hình 3.7 Ảnh giãn độ tương phản 40

Hình 3.8 Ảnh cắt theo mức không nền và có nền 41

Hình 3.9 Ảnh cân bằng và biểu đồ 42

Hình 3.10 Hai ảnh xám gần giông nhau 42

Hình 3.11 Ảnh xám thu được trước và sau khi cân bằng 43

Hình 3.12 Ảnh chèn nhiễu salf & pepper 43

Hình 3.13 Giao diện chương trình mô phỏng các phương pháp chèn và lọc nhiễu 44

Hình 3.14 Ảnh lọc sử dụng bộ lọc trung bình 47

Hình 3.15 Ảnh thu được nhờ bộ lọc Laplace có giá trị -4 và -8 ở chính giữa 48

Hình 3.16 Ảnh lọc không gian phi tuyến 49

Hình 3.17 Ảnh lọc trung vị 3x3 50

Hình 3.18 Ảnh lọc trung bình 50

Hình 3.19 Ảnh lọc thông thấp 51

Hình 3.20 Ảnh lọc thông cao cơ bản 51

Hình 3.21 Ảnh lọc emphasis cao tần 52

Hình 3.22 Ảnh lọc tần sô từ không gian 53

Hình 3.23 Giao diện nén ảnh JPEG và JPEG2000 55

Trang 6

Đồ án tốt nghiệp đại học Danh mục bảng biểu

DANH MỤC BẢNG BIỂU

Bảng 2.1 Sô bit mỗi pixel 30Bảng 3.1 Các bộ lọc đặc biệt 45

Trang 7

THUẬT NGỮ VIẾT TĂT

Thuật ngữ Tên tiếng Anh Tiếng Việt

D

DCT Discrete Cosin Transform Biến đổi cosin rời rạc

DFT Discrete Fourier Transform Biến đổi Fourier rời rạc

DWT Discrete Wavelet Transform Biến đổi Wavelet rời rạc

IPT Image Processing Toolbox Hộp công cụ xử lí ảnh

ISO International Organization for

Trang 8

Đồ án tốt nghiệp đại học Thuật ngữ viết tắt

S

SNR Signal-to-Noise Ratio Tỷ sô tín hiệu trên nhiễu

R

RMSE Root Mean Square Error Lỗi trung bình quân phương

Trang 9

LỜI NÓI ĐẦU

Trong nhiều thập kỷ gần đây, cùng với sự tiến bộ của khoa học kỹ thuật, sự pháttriển mạnh mẽ của máy tính và sự ra đời của Internet thì nhu cầu các dịch vụ

dữ liệu truyền trên mạng là rất lớn, nhất là dữ liệu đa phương tiện Ảnh sô ra đờikhiến cho nhu cầu của con người về chất lượng ảnh cung ngày càng tăng cao Conngười sử dụng ảnh sô cho nhiều mục đích, nhiều lĩnh vực khác nhau, từ nghệ thuật, yhọc cho tới thiên văn học, địa lý,…Vì vậy ảnh sô phải được xử lí sao cho phù hợp vớitừng mục đích cụ thể Xuất phát từ nhu cầu đó của con người, nhiều kỹ thuật xử lí ảnh

sô ra đời Xử lí ảnh sô mặc dù là một khoa học còn tương đôi mới mẻ so với nhiềungành khoa học khác nhất là trên quy mô công nghiệp, song nó đã đem lại nhiều lợiích Xử lí ảnh sô bao gồm việc tìm tòi nghiên cứu về các kĩ thuật nén ảnh để đảm bảotiết kiệm băng thông truyền dẫn, giảm bớt không gian lưu trữ để truyền thông tin trênmạng một cách dễ dàng và nhanh chóng Ngoài ra, các thuật toán nhằm nâng cao chấtlượng ảnh cung là một vấn đề đòi hỏi sự đầu tư nghiên cứu Các thuật toán, các phépbiến đổi nâng cao chất lượng ảnh mà chúng ta đã biết như tạo ảnh âm bản, chèn nhiễu,tăng, giãn độ tương phản, biến đổi logic sô học, phép lọc…

Các kỹ thuật nén sử dụng phép biến đổi Fourier (FT), biến đổi cosine rời rạc(DCT), biến đổi Wavelet (DWT) có nhiều ưu điểm không chỉ trong xử lí ảnh màcòn nhiều ứng dụng khác Bằng chứng là sự ra đời của chuẩn nén JPEG (DCT) vàJPEG2000 (dựa trên DWT) đang được sử dụng rất rộng rãi

Với mục tiêu xây dựng chương trình mô phỏng, minh họa cho các kĩ thuật nângcao chất lượng và nén ảnh, em quyết định chọn đề tài này để làm đồ án tôt nghiệp

Đồ án của em chia làm 3 chương:

- Chương 1 giới thiệu tổng quan về ảnh sô và các kĩ thuật nâng cao chất lượngảnh như biến đổi ảnh xám, biến đổi âm bản, các phương pháp lọc ảnh nhiễu

- Chương 2 giới thiệu về kĩ thuật nén ảnh và đi sâu vào 2 chuẩn nén ảnh JPEGvà JPEG2000

- Chương 3 giới thiệu tổng quan về ngôn ngữ lập trình Matlab và chương trình

mô phỏng kĩ thuật nâng cao chất lượng và nén ảnh bằng Matlab

Trang 10

Đồ án tốt nghiệp đại học Lời nói đầu

Em xin chân thành cảm ơn thầy giáo, ThS Nguyễn Xuân Hoàng đã nhiệt tìnhhướng dẫn, tạo điều kiện giúp đỡ em hoàn thành đồ án này

Hà nội, tháng 11 năm 2008

Sinh viênNguyễn Phương Hiền

Trang 11

CHƯƠNG 1 TỔNG QUAN ẢNH SỐ VÀ CÁC KĨ THUẬT NÂNG CAO CHẤT

LƯỢNG ẢNH

Lịch sử của xử lí ảnh bắt nguồn từ việc nâng cao chất lượng hình ảnh đượctruyền qua giữa đường cáp London và NewYork vào năm 1920 Lúc ấy xử lí ảnh chỉđơn giản là xử lí phân bô các mức sáng (mức xám và độ phân giải của ảnh) Việc nângcao chất lượng ảnh bằng các phương pháp xử lí để truyền ảnh sô được nghiên cứu liêntục 35 năm sau đó Do kỹ thuật máy tính ngày càng phát triển, nên xử lí ảnh và nângcao chất lượng ảnh cung phát triển rất nhanh

Trong chương này, ta tìm hiểu về một sô kĩ thuật nâng cao chất lượng ảnh nhưbiến đổi ảnh xám, các phương pháp lọc nhiễu, làm nổi đường biên ảnh Các kĩ thuậtnày hiện nay đang được ứng dụng rộng rãi trong nhiều lĩnh vực

1.1 Tổng quan về ảnh sô

Hình ảnh tĩnh có thể được biểu diễn bởi hàm 2 chiều f(x,y), trong đó x và y là tọađộ không gian phẳng (2 chiều) Khi xét ảnh “đen-trắng”, giá trị hàm f tại một điểmđược xác định bởi tọa độ (x, y) được gọi là độ chói (mức xám) của ảnh tại điểm này.Nếu x, y và f là các giá trị rời rạc, ta gọi ảnh đó là ảnh sô Xử lí ảnh sô là quá trìnhbiến đổi ảnh sô trên máy tính Như vậy, ảnh sô được tạo ra bởi một sô hữu hạn cácđiểm ảnh, mỗi điểm ảnh nằm tại một vị trí nhất định và có một giá trị nhất định Mộtđiểm ảnh trong một ảnh còn được gọi là một pixel

1.2 Các kĩ thuật nâng cao chất lượng ảnh

Hệ thông thị giác là cơ quan cảm nhận hình ảnh quang học tương đôi hoàn hảo,cho phép con người cảm nhận được hình ảnh quang học trong thiên nhiên Ứng dụngquan trọng nhất của nâng cao chất lượng ảnh là biến đổi tính chất của ảnh sô nhằm tạocảm nhận về sự gia tăng chất lượng hình ảnh quang học

1.2.1 Biến đổi mức xám

Hàm biến đổi mức xám có công thức như sau:

Trang 12

Đồ án tốt nghiệp đại học Chương 1: Nâng cao chất lượng ảnh

trong đó r: mức xám ảnh vào f(x, y)

s: mức xám ảnh ra g(x, y)

T: hàm biến đổi mức xám

1.2.1.1 Biến đổi âm bản

Âm bản của một ảnh có các mức xám trong khoảng [0, L-1] được tạo ra nhờ phépbiến đổi âm Phép biến đổi này ứng dụng rất nhiều trong các phim ảnh trong y học.Hàm sử dụng trong ảnh âm bản như sau:

trong đó L: mức xám cao nhất

u: mức xám của ảnh vào

f(u): hàm biến đổi mức xám của ảnh vào

Hình 1.1 Biến đổi âm bản [7]

Phép biến đổi này phù hợp cho việc nâng cao các chi tiết trắng hoặc xám nằmtrong vùng tôi của ảnh, đặc biệt là khi vùng tôi chiếm phần lớn kích thước ảnh

1.2.1.2 Biến đổi log

Các biến đổi log được thực hiện bằng cách sử dụng công thức:

trong đó r: mức xám ảnh vào

c: hằng sô

s: mức xám ảnh ra

Trang 13

Hình 1.2 Đồ thị hàm log 1.2.1.3 Biến đổi hàm mu

Phép biến đổi theo hàm mu có công thức cơ bản như sau:

trong đó r: mức xám ảnh vào

s: mức xám ảnh ra

c và : các hằng sô dương

Hình 1.3 Đồ thị hàm mu 1.2.1.4 Giãn độ tương phản

Hàm biểu diễn trong hình 1.4 được gọi là một hàm biến đổi giãn độ tương phản bởi vì nó nén các mức đầu vào thấp hơn m thành một khoảng hẹp các mức tôi trên ảnh

Trang 14

ra; tương tự, nó nén các giá trị phía trên m thành một băng hẹp các mức sáng trên đầu

ra Kết quả ra là một ảnh có độ tương phản cao hơn

Hình 1.4 Biến đổi giãn độ tương phản 1.2.1.5 Kĩ thuật cắt theo mức

Kỹ thuật này dùng 2 phép ánh xạ khác nhau cho trường hợp có nền và không nền

b u a khi L u

0)

Đồ thị tương ứng của các hàm này như sau:

Hình 1.5 Đồ thị kĩ thuật cắt theo mức

Biến đổi này cho phép phân đoạn một sô mức xám từ phần còn lại của ảnh Nó cótác dụng khi nhiều đặc tính khác nhau của ảnh nằm trên nhiều miền mức xám khácnhau

Trang 15

1.2.2 Cân bằng mức xám

Ảnh có mức xám từ [0, L-1] sẽ có biểu đồ mức xám là:

với rk là mức xám thứ k và nk là sô pixel trong ảnh có cùng mức xám là rk

Có thể chuẩn hóa bằng cách chia nk cho tổng sô pixel của cả ảnh Biểu đồ chuẩnhóa sẽ là: p(rk)= nk/n, n là tổng sô pixel của cả ảnh p(rk) phản ánh xác suất xuất hiệncủa mức xám rk Chú ý là tổng các thành phần biểu đồ chuẩn hóa phải bằng 1

Biểu đồ có thể coi là phản ánh xấp xỉ xác suất xuất hiện của các giá trị mức xámtrong ảnh Biểu đồ chính là nền tảng của đa sô kỹ thuật xử lí miền không gian, còn cóthể sử dụng cho các kỹ thuật nén ảnh, phân rã ảnh… Vận dụng biểu đồ có hiệu quả rấttôt đôi với nâng cao chất lượng ảnh

Đôi với các ảnh có mức xám quá tập trung ở vùng tôi hoặc vùng trắng, chúng tacó thể sử dụng phương pháp cân bằng mức xám của ảnh để phân tán biểu đồ xám

Ta định nghĩa hàm s như sau bằng T(r), r thuộc [0, 1] thỏa mãn các điều kiện sau:

- T(r) đơn trị và đơn điệu tăng trên [0, 1] (a)

- 0 ≤ T(r) ≤ 1 với 0 ≤ r ≤ 1 (b)với s và T(r) là mức xám ảnh ra và biến đổi T của mức xám ảnh vào

Điều kiện (a) để đảm bảo tồn tại quá trình biến đổi ngược và điều kiện đơn điệutăng để đảm bảo ảnh sau khi biến đổi không bị thay đổi thứ tự mức xám (trắng thànhđen và ngược lại)

Hình 1.6 Biểu đồ hàm s = T(r)

Trang 16

Với pr(w) là xác suất của mức xám w:

0

)(

= 



k j

1.2.3 So sánh mức xám

Có những ảnh khi quan sát ta khó có thể phân biệt được sư khác nhau giữa haiảnh xám Để có thể so sánh hai ảnh một cách rõ ràng chúng ta có thể sử dụng phép trừhai ảnh này cho nhau: mức xám của điểm ảnh thu được sẽ bằng mức xám của điểmảnh trên ảnh thứ nhất trừ cho mức xám trên điểm ảnh thứ hai Kĩ thuật này thườngđược dùng trong dự báo thời tiết và trong y học

1.2.4 Chèn nhiễu

Khi truyền ảnh đi trên một kênh truyền nào đó thì sẽ có ảnh hưởng của nhiễu,việc loại bỏ nhiễu sẽ đưa ra ảnh có chất lượng cao hơn Thông thường, người ta xétđến 3 loại nhiễu chính:

• Nhiễu cộng: Nhiễu cộng thường phân bô khắp ảnh Nếu gọi ảnh quan sát (ảnh

thu được) là Xqs, ảnh gôc là Xgôc, nhiễu là η, ảnh thu được có thể biểu diễn bởi:

Trang 17

1.2.5 Lọc ảnh

Phương pháp lọc ảnh có khá nhiều ứng dụng để xử lí ảnh xám với các mục đíchkhác nhau: làm mịn ảnh, tăng độ nét của ảnh… Ta xét đến hai khái niệm lọc khônggian và lọc tần sô Lọc trong miền không gian là nhân chập một ảnh xám f(x, y) với 1mặt nạ lọc h(x, y) (là một ma trận H kích thước nhỏ) để tạo ra ảnh mới Trên thực tế,tích chập không gian thường được đơn giản hóa bằng cách sử dụng các mặt nạ nhỏ,giữ lại các đặc điểm nổi bật của các ảnh Với f(x, y) là ảnh vào, g(x, y) là ảnh ra, h(x,y) là mặt nạ lọc, ta có:

g(x, y) = f(x, y) ⊗ h(x, y) (1.13)

Ta cung có thể làm tương tự trong miền tần sô bằng cách nhân F(u, v) với H(u,v), đây chính là biến đổi Fourier của lọc không gian Người ta thường gọi H(u, v) làhàm truyền đạt Tùy thuộc ma trận sử dụng mà ta nhận được các kết quả khác nhau

G(u, v) = F(u, v) H(u, v) (1.14)với F(u, v), G(u, v) là biến đổi Fourier của ảnh vào và ảnh ra, H(u, v) là hàm truyền đạtcủa bộ lọc

Hình 1.7 Cơ chế lọc không gian

Trang 18

1.2.5.1 Lọc làm mịn ảnh

Ý tưởng của phương pháp lọc làm mịn là thay giá trị của một pixel bằng giá trịmức xám trung bình của các pixel trong mặt nạ Phương pháp này sẽ giúp loại bỏ cácchi tiết không liên quan trước khi thực hiện tách các đôi tượng trong ảnh Chi tiết ởđây là nhóm các pixel có kích thước rất nhỏ so với mặt nạ Tuy nhiên phương phápnày tạo ra tác dụng không mong muôn là làm giảm độ nét của ảnh

a Lọc không gian tuyến tính

Lọc không gian tuyến tính là quá trình lọc mà các phép toán thực hiện trên cácpixel của các vùng lân cận là tuyến tính

Với lọc tuyến tính, đáp ứng được đưa ra bởi phép cộng các hệ sô của bộ lọc nhânvới pixel ảnh tương ứng trong vùng được quét bởi mặt nạ

Ví dụ cho lọc tuyến tính với mặt nạ 3x3, đáp ứng R tại điểm (x,y):

R = w(- 1, - 1) f(x - 1, y - 1) + w(- 1, 0) f(x - 1, y) +…+ w(0, 0) f(x, y) + +w(1, 0) f(x + 1, y) + w(1, 1) f(x + 1, y + 1) (1.15)

b Lọc không gian phi tuyến

Đôi với lọc phi tuyến thì giá trị của đáp ứng R không đơn thuần là tổng của cáctích của hệ sô bộ lọc với các giá trị pixel tương ứng, mà nó còn phụ thuộc vào bản thângiá trị của các pixel

Lọc thông kê thứ tự là lọc phi tuyến trong đó đáp ứng R của bộ lọc được tạo radựa trên thứ tự của các pixel trong vùng được quét bởi mặt nạ

Điển hình cho loại này là lọc trung vị Giông như tên gọi của nó, trong phép lọctrung vị, giá trị mức xám của pixel sẽ được thay thế bởi mức xám trung bình của cácpixel lân cận nó Phương pháp này được sử dụng khá phổ biến để giảm nhiễu, đặc biệtlà loại nhiễu xung (impulse noise hay còn gọi là saft-and-pepper noise)

c Lọc trung bình

Do có nhiều loại nhiễu can thiệp vào quá trình xử lí ảnh nên cần có nhiều bộ lọcthích hợp Trường hợp tổng quát có thể dùng phương pháp lọc trung bình với các bộlọc có kích thước khác nhau, mỗi điểm ảnh được thay thế bằng trung bình trọng sô củacác điểm lân cận và được định nghĩa như sau:

Trang 19

với y(m, n) là ảnh đầu vào, v(m, n) là ảnh đầu ra và a(k, l) là cửa sổ lọc, ak,l = 1/Nw và

Nw là sô điểm ảnh trong cửa sổ lọc W

d Lọc thông thấp miền tần sô

Về cơ bản, ý tưởng lọc trong miền tần sô là lựa chọn một hàm truyền đạt để nhânvới F(u, v), tạo ra một ảnh mới Ví dụ, ta có một hàm truyền đạt mà khi nhân hàm nàyvới một F(u, v) trung tâm sẽ làm suy giảm các thành phần cao tần của F(u, v), trongkhi đó việc loại bỏ các tần sô thấp gần như không thay đổi

1.2.5.2 Lọc sắc nét ảnh

Mục đích của lọc làm sắc nét ảnh là làm nổi bật các chi tiết nhỏ hoặc chi tiết bị

mờ, có thể do nhiễu hoặc do quá trình thu nhận ảnh Các kĩ thuật lọc làm sắc nét đều làlọc miền tần sô

a Lọc thông cao

Lọc thông thấp làm mờ một ảnh, ngược lại, lọc thông cao lọc sắc nét ảnh nhờ làmsuy giảm các thành phần tần thấp và loại bỏ gần hết các thành phần cao tần của biếnđổi Fourier

Lọc thông cao cơ bản

Cho hàm truyền đạt Hlp(u, v) của 1 bộ lọc thông thấp, ta thu được hàm truyền đạtcủa bộ lọc thông cao tương ứng nhờ sử dụng:

Hhp(u,v) = 1 – Hlp(u,v) (1.18) [2]

Lọc emphasis cao tần

Các bộ lọc thông cao như trên sẽ làm giảm giá trị trung bình của ảnh tới 0 Như

ta đã thấy ở trên, ảnh lọc nét hơn nhưng lại tôi hơn nhiều so với ảnh gôc Một phươngpháp giải quyết vấn đề này là chèn thêm vào một offset để lọc thông cao Khi offset

Trang 20

kết hợp với việc nhân bộ lọc với một sô lớn hơn 1 thì phương pháp này được gọi là lọc emphasis cao tần bởi vì phép nhân làm nổi rõ các tần sô cao

Emphasis cao tần có hàm truyền đạt:

Hhfe(u,v) = a + bHhp(u,v) (1.19) [2]

trong đó a là offset, b là sô nhân và Hhp(u, v) là hàm truyền đạt của bộ lọc thông cao

Để có kết quả lọc cao hơn, sau khi lọc emphasis cao tần ta nên sử dụng phương pháp

cân bằng biểu đồ

b Lọc tần sô từ không gian

Thông thường, lọc trong miền không gian có hiệu suất tính toán cao hơn lọc miền

tần sô khi các bộ lọc nhỏ Định nghĩa nhỏ khá phức tạp, nó phụ thuộc vào các hệ sô

lọc, kích thước của bộ đệm, các dữ liệu phức hợp được xử lí như thế nào Tuy nhiên,khi đem ra so sánh, ta thấy bộ lọc sử dụng thuật toán FFT có thể nhanh hơn là một bộlọc trong miền không gian Do đó, người ta nhận thấy nên chuyển lọc không gianthành kĩ thuật lọc miền tần sô tương đương chứa ưu điểm của cả hai phương pháp này

1.2.5 Các kĩ thuật làm nổi đường biên ảnh

Làm nổi biên ảnh là vấn đề quan trọng trong phân tích ảnh Trước hết, ta cần tìmhiểu về khái niệm biên ảnh Một điểm ảnh được coi là nằm trên đường biên nếu tại vịtrí điểm ảnh đó có sự thay đổi đột ngột của mức xám Như vậy, đường biên là đườngnôi các điểm ảnh nằm trong khu vực ảnh có thay đổi đột ngột về độ chói, đường biênthường ngăn cách hai vùng ảnh có các mức xám gần như không đổi

Hình 1.8 Đường biên của ảnh

Trong trường hợp lí tưởng, độ chói giữa hai vùng ảnh thay đổi đột ngột hoặc tăngdần đều Tuy nhiên trên thực tế, mức xám giữa các vùng ảnh thay đổi tương đôi ngẫunhiên Chính vì vậy quá trình phát hiện đường biên thường không đơn giản và kết quảthường không hoàn toàn chính xác

Trang 21

1.3 Kết luận chương 1

Kết thúc chương 1, một sô kĩ thuật nâng cao chất lượng ảnh như biến đổi ảnhxám (biến đổi âm bản, biến đổi hàm log, hàm mu), lọc nhiễu (lọc thông thấp, thôngcao, lọc phi tuyến, tuyến tính, lọc trung vị,…), làm nổi biên ảnh đã được đề cập đến.Trên thực tế, nâng cao chất lượng ảnh còn rất nhiều vấn đề đáng chú ý khác như các kĩthuật làm trơn ảnh, tách nhiễu, khử nhiễu, làm trơn biên, khuếch đại ảnh, lọc đồnghình, lọc ngoài, lọc giả trung vị

Trang 22

Đồ án tốt nghiệp đại học Chương 2: Các kĩ thuật nén ảnh

CHƯƠNG 2 CÁC KĨ THUẬT NÉN ẢNH

Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet thì việctìm một phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin và truyềnthông tin trên mạng nhanh chóng đang là một yêu cầu cấp thiết Trong những năm gầnđây, có rất nhiều các phương pháp đã và đang được nghiên cứu rộng rãi để thực hiệnnén ảnh Tất cả đều với một mục đích chung là làm thế nào để biểu diễn một ảnh với ítbit nhất để có thể tôi thiểu hoá dung lượng kênh truyền và không gian lưu trữ trong khivẫn giữ được tính trung thực của ảnh Điều này tương đương với việc biểu diễn ảnh cóđộ tin cậy cao nhất với tôc độ bit nhỏ nhất

2.1 Tổng quan về nén ảnh

2.1.1 Giới thiệu chung về nén ảnh sô

Thông thường, ảnh đen trắng chưa nén được biểu diễn bằng 8 bit/pixel và ảnhmàu là 24 bit/pixel Các kỹ thuật nén hiện nay cho phép dung lượng ảnh được néngiảm 30 đến 50 lần so với ảnh gôc mà ảnh vẫn giữ được độ trung thực cao Độ trungthực của ảnh được đánh giá dựa trên tiêu chí như lỗi trung bình quân phương (MSE)hoặc tỷ sô tín hiệu trên nhiễu (SNR) giữa ảnh gôc và ảnh nén

Những phương pháp thường (như Compress trong hệ UNIX) không đem lại hiệuquả: tỷ lệ nén dữ liệu cho hình ảnh không quá 2:1 Nhưng với những phương phápchuyên dụng có thể đạt tới 30:1 Hai phương pháp nén hình ảnh nổi tiếng nhất hiệnnay là của nhóm chuyên gia về hình ảnh động (Motion Picture Experts Group -MPEG) và liên hiệp các nhóm chuyên gia về hình ảnh (Joint Photo Graphic ExpertsGroup - JPEG) Những phương pháp này đã trở thành chuẩn công nghiệp Nhữngnhược điểm cơ bản của các phương pháp này là sự mất mát thông tin và hiệu quả nénkhông cao đôi với những hình ảnh phức tạp

Tất cả các phương pháp nén ảnh đều dựa trên một nguyên lý đơn giản: trong dữliệu có nhiều phần tử thừa và nén ảnh dựa trên cơ sở tìm ra những phần tử đó và loạibỏ chúng

Trang 23

Các phương pháp thông dụng hiện nay như biến đổi cosin rời rạc, nén ảnhWavelet (WIC) phải dùng đến biến đổi toán học và xấp xỉ các môi tương quan giữa cácpixel Với các phương pháp này ta có thể nén ảnh tới tỷ lệ 20:1 – 30:1 Nhưng nhữngảnh này (vì bị mất thông tin) chỉ là những ảnh gần đúng với ảnh ban đầu, ngoài ra còncó thể xuất hiện biến dạng hình ảnh.

2.1.2 Sơ đồ khôi hệ thông nén ảnh điển hình

Hình 2.1 Sơ đồ khôi một hệ thông nén ảnh điển hình

- Khôi biến đổi: Thường dùng phép biến đổi cosin rời rạc để tập trung năng lượng tínhiệu vào một sô lượng nhỏ các hệ sô khai triển để thực hiện phép nén hiệu quả hơn làdùng tín hiệu nguyên thủy

- Khôi lượng tử: Tạo ra một lượng kí hiệu giới hạn cho ảnh nén với hai kĩ thuật:lượng tử vô hướng (thực hiện lượng tử hóa cho từng phần dữ liệu) và lượng tử vector(thực hiện lượng tử hóa một lần một khôi dữ liệu) Quá trình này không thuận nghịch

- Khôi mã hóa: Gán một từ mã, một dòng bit nhị phân cho mỗi kí hiệu, sô nguyêngần nhất

2.1.3 Phân loại các kỹ thuật nén

Có nhiều cách phân loại các phương pháp nén khác nhau Cách thứ nhất dựa vàonguyên lý nén Cách này phân các phương pháp nén thành hai họ lớn:

- Nén ảnh không mất thông tin (nén không tổn hao): Với phương pháp này sau khigiải nén ta khôi phục được chính xác ảnh gôc Các phương pháp nén này bao gồm mãhoá Huffman, mã hoá thuật toán…

- Nén ảnh có mất thông tin (nén có tổn hao): Ảnh giải nén có một sự sai khác nhỏ sovới ảnh gôc Các phương pháp này bao gồm:

 Lượng tử hoá vô hướng: PCM và DPCM

 Lượng tử hoá vector

 Mã hoá biến đổi: biến đổi cosin rời rạc (DCT), biến đổi Fourier nhanh(FFT)

Trang 24

 Mã hoá băng con

Ngoải ra, ta có thể phân loại dựa vào cách thức thực hiện nén Theo cách này,người ta cung phân thành hai họ: Phương pháp nén dữ liệu không gian và phươngpháp sử dụng mã hóa biến đổi Hoặc cung có thể phân loại dựa vào lý thuyết mã hóa.Cách này cung phân các phương pháp nén thành hai họ: Các phương pháp nén thế hệthứ nhất (gồm các phương pháp mà mức độ tính toán là đơn giản, thí dụ việc lấy mẫu,gán từ mã, ) và các phương pháp nén thế hệ thứ hai (dựa vào độ bão hòa của tỷ lệnén)

2.1.4 Các nguyên tắc khi nén ảnh

Một tính chất chung nhất của tất cả các ảnh sô đó là tương quan giữa các pixel ởcạnh nhau lớn, điều này dẫn đến dư thừa thông tin để biểu diễn ảnh Dư thừa thông tin

sẽ làm cho việc mã hoá không tôi ưu Do đó công việc cần làm để nén ảnh là phải tìmđược các biểu diễn ảnh với tương quan nhỏ nhất để giảm thiểu độ dư thừa thông tincủa ảnh Thực tế, có hai kiểu dư thừa thông tin được phân loại như sau:

- Dư thừa trong miền không gian: tương quan giữa các giá trị pixel của ảnh, điều nàycó nghĩa rằng các pixel lân cận của ảnh có giá trị gần giông nhau (trừ những pixel ởgiáp đường biên ảnh)

- Dư thừa trong miền tần sô: Tương quan giữa các mặt phẳng màu hoặc dải phổ khácnhau

Trọng tâm của các nghiên cứu về nén ảnh là tìm cách giảm sô bit cần để biểudiễn ảnh bằng việc loại bỏ dư thừa trong miền không gian và miền tần sô càng nhiềucàng tôt

2.1.5 Dư thừa sô liệu

Nén sô liệu là quá trình giảm lượng sô liệu cần thiết để biểu diễn cùng một lượngthông tin cho trước Cần phải phân biệt giữa sô liệu và thông tin Thực tế, sô liệu vàthông tin không đồng nghĩa với nhau Sô liệu (tín hiệu) chỉ là phương tiện dùng đểtruyền tải thông tin Cùng một lượng thông tin cho trước có thể biểu diễn bằng cáclượng sô liệu khác nhau

Trong nén ảnh sô, có ba loại dư thừa sô liệu có thể được nhận dạng và phân biệt

Trang 25

2.1.5.1 Dư thừa mã (Coding Redundancy)

Nếu các mức của tín hiệu video được mã hóa bằng các symbol nhiều hơn cầnthiết (tuyệt đôi) thì kết quả là có độ dư thừa mã Để giảm độ dư thừa mã, trong nén ảnhthường sử dụng các mã VLC như mã Huffman, mã RLC Lượng thông tin về hìnhảnh có xác suất thấp hơn

Nguyên lý cơ bản của việc nén ảnh này là các từ mã có độ dài biến đổi, cho phépgán các từ mã ngắn nhất cho các mức xám có tần suất xuất hiện nhiều nhất trong ảnh.Câu hỏi được đặt ra là: Cần bao nhiêu bit để thay thế cho các mức xám trong một ảnh.Đó là, liệu có tồn tại dữ liệu nhỏ đủ để mã hóa đầy đủ một ảnh mà không gây ra tổnthất?

Ý tưởng này là khởi đầu cho việc thông tin có thể được xử lí giông như cách xử líxác suất Với giả định này, một sự kiện ngẫu nhiên E với xác suất P(E) có chứa lượngthông tin:

I(E) = log

)(

H = – 



J j

j

a P

1

)(log)

Nếu một ảnh nhận được là một mẫu “nguồn mức xám”, chúng ta có thể mô hìnhhóa các xác suất kí hiệu của nguồn bằng cách sử dụng một ma trận mức xám của ảnhnày và tính toán giá trị xấp xỉ (gọi là xấp xỉ thứ tự ưu tiên: first-order estimate) củaentropy gôc:

P

1

)(log)

Giá trị xấp xỉ được tính toán bởi hàm entropy (với giả thiết mỗi mức xám đượcmã hóa độc lập) có biên thấp hơn nhờ việc loại bỏ dư thừa mã

Trang 26

2.1.5.2 Dư thừa trong pixel ( Interpixel Redudancy)

Vì giá trị của một pixel bất kì nào đó cung có thể được dự báo từ giá trị của cáclân cận của nó, nên thông tin từ các pixel riêng là tương đôi nhỏ Sự tham gia của mộtpixel riêng vào một ảnh là dư thừa Nhiều tên (bao gồm: dư thừa không gian, dư thừahình học, dư thừa trong ảnh) được đặt ra để phân biệt sự phụ thuộc này của các pixel

Ta dùng độ dư thừa trong pixel để chỉ tất cả các tên trên Để giảm độ dư thừa trongpixel của một ảnh, dãy pixel hai chiều dùng cho việc nhìn và nội suy, phải được biếnđổi thành một dạng có hiệu quả hơn

Người ta đưa ra một phương pháp gọi là mã hóa dự đoán không tổn thất để loại

bỏ các dư thừa trong pixel của các pixel kề nhau bằng cách chỉ đưa ra và mã hóa thôngtin mới trong mỗi pixel “Thông tin mới” của 1 pixel là sự khác biệt giữa giá trị thực tếvà giá trị dự đoán của pixel đó

Hình 2.2 Mô hình mã hóa dự đoán không tổn thất bao gồm bộ mã hóa và bộ giải mã 2.1.5.3 Dư thừa tâm sinh lý (Psychovisual Redudancy)

Bằng trực quan ta thấy, sự thu nhận cường độ ánh sáng thay đổi chỉ giới hạntrong một phạm vi nhất định Hiện tượng này xuất phát từ sự thật là mắt không đápứng với cùng độ nhạy của tất cả các thông tin nhìn thấy Thông tin đơn giản có tầmquan trọng ít hơn thông tin khác trong vùng nhìn thấy Thông tin này được gọi là độ dưthừa tâm sinh lý Nó có thể được loại bỏ mà không ảnh hưởng đáng kể đến chất lượng

Trang 27

thu nhận ảnh Khác với độ dư thừa mã và dư thừa trong pixel, độ dư thừa tâm sinh lýcó liên quan đến thông tin theo định lượng Quá trình loại bỏ nó là đáng kể bởi vìthông tin của nó không cần thiết cho quá trình xử lí thị giác chuẩn Dư thừa tâm sinh lícó quan hệ tới việc lượng tử hóa Điều đó có nghĩa là ánh xạ một khoảng rộng các giátrị đầu vào lên một sô hữu hạn các giá trị đầu ra Khi nó là toán tử không đảo ngược(mất thông tin) cho kết quả nén sô liệu có tổn hao.

2.1.6 Giới thiệu một sô kỹ thuật sử dụng trong nén ảnh

2.1.6.1 Mã hoá dựa trên phép biến đổi DCT

Nguyên tắc chính của phương pháp mã hoá này là biến đổi tập các giá trị pixelcủa ảnh trong miền không gian sang một tập các giá trị khác trong miền tần sô sao chocác hệ sô trong tập giá trị mới này có tương quan giữa các điểm ảnh gần nhau nhỏ hơn

Hình 2.3 Sơ đồ mã hóa và giải mã dùng biến đổi DCT [4]

a Biến đổi DCT thuận và nghịch

Vì ảnh gôc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT, ảnhđược phân chia thành các khôi vuông, mỗi khôi này thường có kích thước 8 x 8 pixelvà biểu diễn các mức xám của 64 điểm ảnh, các mức xám này là các sô nguyên dươngcó giá trị từ 0 đến 255 Việc phân khôi này sẽ làm giảm được một phần thời gian tínhtoán các hệ sô chung, mặt khác biến đổi cosin đôi với các khôi nhỏ sẽ làm tăng độchính xác khi tính toán với dấu phẩy tĩnh, giảm thiểu sai sô do làm tròn sinh ra

Biến đổi DCT là một công đoạn chính trong các phương pháp nén sử dụng biếnđổi Hai công thức ở đây minh hoạ cho 2 phép biến đổi DCT thuận nghịch đôi với mỗi

Trang 28

khôi ảnh có kích thước 8 x 8 Giá trị x(n1, n2) biểu diễn các mức xám của ảnh trongmiền không gian, X(k1, k2) là các hệ sô sau biến đổi DCT trong miền tần sô

Hình 2.4 Các bước của quá trình mã hóa biến đổi DCT đôi với 1 khôi [4]

Trang 29

Chú ý rằng bản thân biến đổi DCT không làm mất thông tin vì DCT là một biếnđổi tuyến tính chuyển các giá trị của điểm ảnh từ miền không gian thành các hệ sôtrong miền tần sô Nếu biến đổi DCT thuận và nghịch được tính toán với độ chính xáctuyệt đôi và nếu các hệ sô DCT không phải qua bước lượng tử và mã hoá thì ảnh thuđược sau biến đổi DCT ngược sẽ giông hệt ảnh gôc.

b Lượng tử và giải lượng tử

Sau khi thực hiện biến đôi DCT, 64 hệ sô sẽ được lượng tử hoá dựa trên một bảng

lượng tử gồm 64 phần tử Q(u,v) với 0 ≤ u, v ≤ 7 Bảng này được định nghĩa bởi từng

ứng dụng cụ thể Các phần tử trong bảng lượng tử có giá trị từ 1 đến 255 được gọi làcác bước nhảy cho các hệ sô DCT Quá trình lượng tử được coi như là việc chia các hệ

sô DCT cho bước nhảy lượng tử tương ứng, kết quả này sau đó sẽ được làm tròn

xuông sô nguyên gần nhất Công thức (2.6) thể hiện việc lượng tử với F(u,v) là các hệ

sô DCT, F Q (u,v) là các hệ sô sau lượng tử, các hệ sô này sẽ được đưa vào bộ mã hoá

),(

v u Q

v u F

Mục đích của việc lượng tử hoá là giảm sô lượng bit cần để lưu trữ các hệ sô biếnđổi bằng việc giảm độ chính xác của các hệ sô này cho nên lượng tử là quá trình xử lícó mất thông tin

Quá trình giải lượng tử ở phía bộ giải mã được thực hiên ngược lại Các hệ sô saubộ giải mã entropy sẽ nhân với các bước nhảy trong bảng lượng tử (bảng lượng tửđược đặt trong phần mào đầu của ảnh JPEG) Kết quả này sau đó sẽ được đưa vào biếnđổi DCT ngược

c Mã hóa và giải mã

Mã hoá là bước cuôi cùng trong hệ thông nén ảnh dựa trên biến đổi DCT Chuẩnnén ảnh JPEG hiện nay dùng phương pháp mã hoá Huffman, đây là phép mã hoákhông làm mất thông tin Phương pháp này dựa trên mô hình thông kê Dựa vào dữliệu gôc, người ta tính tần suất xuất hiện các hệ sô Việc tính tần suất được thực hiệnbằng cách duyệt tuần tự từ đầu khôi đến cuôi khôi, sau đó, những hệ sô có tần suất caođược gắn cho một từ mã ngắn, các hệ sô có tần suất thấp được gán một từ mã dài Vớicách thức này chiều dài trung bình của từ mã đã giảm xuông

Trang 30

Các hệ sô thu được sau khi lượng tử hoá sẽ được sắp xếp thành một chuỗi các kýhiệu theo kiểu “zig-zag” (theo đường zig-zag trong hình 2.4) để đặt các hệ sô có tần sôthấp lên trước các hệ sô tần sô cao Các hệ sô này sẽ được mã hoá dựa trên bảng mãHuffman sao cho chiều dài trung bình của từ mã là nhỏ nhất Bảng mã này cung sẽđược đặt trong phần mào đầu của ảnh để thực hiện giải nén ảnh

2.1.6.2 Kỹ thuật mã hoá băng con

a Ý tưởng mã hoá băng con

Mặc dù với tất cả các ưu điểm của nén ảnh JPEG dựa trên biến đổi DCT như:tính toán đơn giản, chất lượng tôt và dễ dàng thực hiện về mặt phần cứng Nhưngphương pháp này cung không hẳn là không có nhược điểm Vì ảnh đầu vào được phânchia thành nhiều khôi độc lập, các khôi này được thực hiện biến đổi DCT riêng chonên vẫn có tương quan ở dọc đường biên của các khôi Điều này sẽ gây ra lỗi khôi khithực hiện mã hoá với tôc độ bit thấp Trong một ảnh sô, các thành phần tần sô cao chủyếu tập trung ở vùng biên của ảnh, đấy là nơi mà các giá trị mức xám của các điểmảnh có độ chênh lệch lớn Mà trong đa sô các ảnh, các chi tiết của ảnh thường thay đổichậm tức là chênh lệch mức xám giữa các điểm ảnh gần nhau nhỏ Như vậy có thể kếtluận rằng phổ tần của ảnh tập trung chủ yếu ở miền tần sô thấp Trong các phươngpháp nén ảnh trước đây, việc mã hoá thực hiện trong toàn dải tần của ảnh, như vậy sẽgây dư thừa thông tin khi mã hoá trong miền tần sô cao vì ở tần sô cao không có nhiềuthông tin của ảnh Vì vậy, cần thiết phải đưa ra một phương pháp mới tôi ưu hơn

Ý tưởng của phương pháp mã hoá băng con là chia dải tần sô của ảnh thành nhiềudải tần con và mã hoá ở mỗi dải tần một sô lượng bit khác nhau Ví dụ, ở dải tần sôcao sô bit mã hoá sẽ không cần nhiều bằng ở miền tần sô thấp Với phương pháp nàyhiệu quả nén sẽ tăng lên và nhiều khôi cung không xuất hiện nữa do không phải phânchia ảnh thành các khôi để xử lí

b Mã hoá băng con

Nguyên tắc cơ bản trong quá trình mã hoá ảnh băng con là phân chia ảnh thànhnhiều dải tần sô thông qua các bộ lọc thông thấp, thông dải và thông cao Các dải tầnnày gọi là các băng con Sau đó, các băng con này sẽ được lượng tử và mã hoá độc lậpnhau, tuỳ thuộc vào tính chất thông kê và mật độ năng lượng của từng dải mà sô bit mãhoá khác nhau

Trang 31

Hình 2.5 a) Băng lọc phân tích; b) Hai bộ lọc thông thấp và thông cao

c) Phần vùng trong miền tần sô; d) Băng lọc tổng hợp

Minh họa trên hình 2.5 (a) Gọi L và H tương ứng là các bộ lọc thông thấp vàthông cao một chiều Tần sô 2 chiều của ảnh được tách ra từng chiều theo trục w1 vàw2 Hình 2.5 (c) mô tả băng lọc được phân thành 4 vùng tần sô LL, LH, HL và HH.Vùng trung tâm (LL) là vùng có tần sô thấp theo cả hai hướng Bôn góc (HH) là vùngcó các thành phần tần sô cao theo cả hai hướng Bôn vùng bên cạnh (HL, LH) là cácvùng có tần sô thấp và tần sô cao, mỗi thành phần đi theo một hướng Chú ý đến các

hệ sô 2 trong hình vẽ 2.5 (a), đó là thành phần giảm mẫu, nó có nhiệm vụ kéo dãnbăng tần của từng băng con để bằng với băng tần của ảnh gôc nhưng với tôc độ lấymẫu thấp hơn

Các vùng tần sô gọi là các băng con sẽ được lượng tử hoá và mã hoá giông nhưvới biến đổi DCT Sau khi lượng tử, mã hoá, lưu trữ, truyền và giải mã ảnh, mỗi băngcon sẽ được tăng mẫu với hệ sô 2 (hình 2.5 (d)) và thông qua các bộ lọc để loại bỏ các

Trang 32

thành phần chồng phổ (alias) của tín hiệu sinh ra do các bộ tăng mẫu Tất cả các băngnày sau đó được cộng lại để khôi phục lại ảnh ban đầu

Trong thực tế, rất nhiều lỗi được tạo ra trong quá trình nén và truyền ảnh: lỗi dolượng tử hoá, do mã hoá, lỗi kênh truyền… bên cạnh đó, bản thân băng lọc còn gây ralỗi do phía thu không khôi phục lại được chính xác tín hiệu phát Do đó, nếu khôngquan tâm đến sự có mặt của các bộ mã hoá và kênh truyền thì trước tiên băng lọc phảicó tính khôi phục hoàn hảo tức là tín hiệu ra phải là một bản trễ nguyên gôc của tínhiệu đầu vào Điều này phụ thuộc vào việc thiết kế các bộ lọc trong băng lọc Có rấtnhiều các nghiên cứu để tìm ra các băng lọc thoả mãn tính khôi phục hoàn hảo Mộttrong những dạng như vậy là băng lọc gương cầu phương QMF (Quadrature MirrorFilter) với bộ lọc thông cao (H) là ảnh gương của bộ lọc thông thấp (L) qua trục П/2(hình 2.5 (b))

2.1.6.3 Biến đổi Wavelet trong nén ảnh

Biến đổi Wavelet

Wavelet là phép biến đổi được sử dụng để phân tích các tín hiệu không ổn định(non-stationary) – là những tín hiệu có đáp ứng tần sô thay đổi theo thời gian

Biến đổi Wavelet được thực hiện theo cách: tín hiệu được nhân với hàm Waveletrồi thực hiện biến đổi riêng rẽ cho các khoảng tín hiệu khác nhau trong miền thời giantại các tần sô khác nhau Cách tiếp cận như vậy còn được gọi là: phân tích đa phân giải– MRA (Multi Resolution Analysis): phân tích tín hiệu ở các tần sô khác nhau và chocác độ phân giải khác nhau MRA khi phân tích tín hiệu cho phép: phân giải thời giantôt và phân giải tần sô kém ở các tần sô cao; phân giải tần sô tôt và phân giải thời giankém ở các tần sô thấp Như vậy kỹ thuật này rất thích hợp với những tín hiệu: có cácthành phần tần sô cao xuất hiện trong khoảng thời gian ngắn, các thành phần tần sôthấp xuất hiện trong khoảng thời gian dài chẳng hạn như ảnh và khung ảnh video

Biến đổi Wavelet rời rạc (DWT)

Có thể hiểu phép biến đổi DWT như là áp dụng một tập các bộ lọc: thông cao vàthông thấp Thiết kế các bộ lọc này tương đương như kỹ thuật mã hoá băng con(subband coding) nghĩa là: chỉ cần thiết kế các bộ lọc thông thấp, còn các bộ lọc thôngcao chính là các bộ lọc thông thấp dịch pha đi một góc 1800 Tuy nhiên khác với mãhoá băng con, các bộ lọc trong DWT được thiết kế phải có đáp ứng phổ phẳng, trơn vàtrực giao

Trang 33

Các thủ tục nén gồm ba bước:

 Phân tích

 Các hệ sô chi tiết theo ngưỡng: Đôi với mỗi mức phân tích từ 1 đến N đều

sử dụng một ngưỡng cho các hệ sô chi tiết

 Khôi phục

Nén ảnh có hai phương pháp thực hiện Thứ nhất là giãn rộng Wavelet theo tínhiệu và lưu giữ chúng bởi một sô lượng rất lớn các hệ sô nguyên bản Trường hợpnày ta có thể thiết lập ngưỡng toàn cục và tất cả các mức phân tích đều sử dụngngưỡng này để thiết lập cho việc phân tích Phương pháp thứ hai là cho phép thiếtlập ngưỡng tự động có thể thay đổi giá trị tùy thuộc vào các mức

a Biến đổi Wavelet 1-D

Phân tích Wavelet 1-D

Bước phân tích: Tín hiệu được cho đi qua các bộ lọc thông cao và thông thấp rồiđược lấy mẫu xuông (down sampling) hệ sô 2 tạo thành biến đổi DWT mức 1

Hình 2.6 minh họa quá trình phân tích Wavelet 1 chiều

Hình 2.6 Sơ đồ khôi phân tích tín hiệu mức j

Biến đổi ngược Wavelet 1-D

Thực hiện biến đổi ngược, bắt đầu từ cAj và cDj, IDWT khôi phục cAj-1, đảongược các bước phân chia bằng việc chèn vào các giá trị 0 và kết hợp các kết quảvới các bộ lọc khôi phục

Trang 34

Các bước khôi phục: Lấy mẫu lên (up sampling) hệ sô 2 rồi sử dụng các bộ lọckhôi phục thông thấp và thông cao

Hình 2.7 minh họa quá trình biến đổi ngược Wavelet 1 chiều

Hình 2.7 Sơ đồ biến đổi ngược Wavelet mức j

Đôi với hình ảnh, áp dụng giải thuật tương tự đôi với các Wavelet hai chiều và cáchàm tỷ lệ nhận được từ các Wavelet một chiều bởi kết quả cắt xén

DWT hai chiều điển hình cho ta sự phân chia của các hệ sô xấp xỉ tại mức j thành bôn thành phần, bao gồm: xấp xỉ tại mức j + 1 và các chi tiết trong ba hướng

(ngang, thẳng đứng, và đường chéo)

b Biến đổi Wavelet rời rạc 2-D

Phân tích Wavelet rời rạc 2-D

Bước phân tích:

Ta sử dụng các bộ lọc riêng biệt, thực hiện biến đổi DWT một chiều dữ liệu vào(ảnh) theo hàng, lấy mẫu xuông, giữ lại các cột có chỉ sô chẵn Rồi ta tiếp tục thựchiện biến đổi DWT một chiều dữ liệu vừa thu được theo cột, lấy mẫu xuông, giữ lạicác hàng có chỉ sô chẵn Theo cách này nếu thực hiện biến đổi DWT ở mức 1, sẽ tạo ra

4 nhóm hệ sô biến đổi Quá trình biến đổi DWT hai chiều có thể minh hoạ như hình2.8

Định dạng
Số trang	68
Dung lượng	3,71 MB