đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH

đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNHMỤC LỤCMỤC LỤCIDANH MỤC HÌNH VẼIVDANH MỤC BẢNG BIỂUVITHUẬT NGỮ VIẾT TẮTVIILỜI NÓI ĐẦUACHƯƠNG 1 TỔNG QUAN ẢNH SỐ VÀ CÁC KĨ THUẬT NÂNG CAO CHẤT LƯỢNG ẢNH11.1 TỔNG QUAN VỀ ẢNH SỐ11.2 CÁC KĨ THUẬT NÂNG CAO CHẤT LƯỢNG ẢNH11.2.1 Biến đổi mức xám11.2.1.1 Biến đổi âm bản21.2.1.2 Biến đổi log21.2.1.3 Biến đổi hàm mũ31.2.1.4 Giãn độ tương phản31.2.1.5 Kĩ thuật cắt theo mức41.2.2 Cân bằng mức xám51.2.3 So sánh mức xám61.2.4 Chèn nhiễu61.2.5 Lọc ảnh71.2.5.1 Lọc làm mịn ảnh8a. Lọc không gian tuyến tính8b. Lọc không gian phi tuyến8c. Lọc trung bình8d. Lọc thông thấp miền tần số91.2.5.2 Lọc sắc nét ảnh9a. Lọc thông cao9b. Lọc tần số từ không gian101.2.5 Các kĩ thuật làm nổi đường biên ảnh101.3 KẾT LUẬN CHƯƠNG 111CHƯƠNG 2 CÁC KĨ THUẬT NÉN ẢNH122.1 TỔNG QUAN VỀ NÉN ẢNH122.1.1 Giới thiệu chung về nén ảnh số122.1.2 Sơ đồ khối hệ thống nén ảnh điển hình132.1.3 Phân loại các kỹ thuật nén132.1.4 Các nguyên tắc khi nén ảnh142.1.5 Dư thừa số liệu142.1.5.1 Dư thừa mã (Coding Redundancy)152.1.5.2 Dư thừa trong pixel ( Interpixel Redudancy)162.1.5.3 Dư thừa tâm sinh lý (Psychovisual Redudancy)162.1.6 Giới thiệu một số kỹ thuật sử dụng trong nén ảnh172.1.6.1 Mã hoá dựa trên phép biến đổi DCT17a. Biến đổi DCT thuận và nghịch17b. Lượng tử và giải lượng tử19c. Mã hóa và giải mã192.1.6.2 Kỹ thuật mã hoá băng con20a. Ý tưởng mã hoá băng con20b. Mã hoá băng con202.1.6.3 Biến đổi Wavelet trong nén ảnh22a. Biến đổi Wavelet 1-D23b. Biến đổi Wavelet rời rạc 2-D242.1.7 Các tiêu chuẩn nén ảnh262.2. GIỚI THIỆU JPEG VÀ JPEG2000262.2.1 JPEG262.2.1.1 Giới thiệu sơ lược262.2.1.2 Sơ đồ khối272.2.2 JPEG2000282.2.2.1 Giới thiệu sơ lược282.2.2.2 Sơ đồ khối bộ mã hóa và bộ giải mã JPEG 2000282.2.3 So sánh JPEG và JPEG2000292.3 KẾT LUẬN CHƯƠNG 231CHƯƠNG 3 CHƯƠNG TRÌNH MÔ PHỎNG323.1 NGÔN NGỮ MATLAB323.1.1 Sơ lược lịch sử Matlab323.1.2 Đặc điểm của Matlab và các ứng dụng343.2 CHƯƠNG TRÌNH MÔ PHỎNG SỬ DỤNG MATLAB353.2.1 Giao diện chương trình mô phỏng353.2.2 Nâng cao chất lượng ảnh363.2.2.1 Biến đổi mức xám36a. Biến đổi mức xám sử dụng hàm imadjust37b. Biến đổi âm bản38c. Biến đổi log39d. Biến đổi hàm mũ39e. Biến đổi giãn độ tương phản40f. Kĩ thuật cắt theo mức413.2.2.2 Cân bằng mức xám413.2.2.3 So sánh mức xám423.2.2.4 Chèn nhiễu433.2.2.5 Lọc ảnh44a. Lọc làm mịn ảnh45b. Lọc sắc nét ảnh513.2.2.6 Các kĩ thuật làm nổi đường biên ảnh533.2.3 Nén ảnh543.2.3.1 Nén ảnh dùng mã hóa Huffman543.2.3.2 Nén ảnh dùng mã dự đoán không tổn thất543.2.3.3 Nén ảnh JPEG dùng biến đổi DCT543.2.3.4 Nén ảnh JPEG2000553.3 KẾT LUẬN CHƯƠNG 356KẾT LUẬN57TÀI LIỆU THAM KHẢO58

Trang 1

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Trang 2

Hà Nội 2008

Trang 3

MỤC LỤC

MỤC LỤC I DANH MỤC HÌNH VẼ IV DANH MỤC BẢNG BIỂU VI THUẬT NGỮ VIẾT TẮT VII LỜI NÓI ĐẦU A CHƯƠNG 1 TỔNG QUAN ẢNH SỐ VÀ CÁC KĨ THUẬT NÂNG CAO CHẤT

LƯỢNG ẢNH 1

1.1 TỔNG QUAN VỀ ẢNH SỐ 1

1.2 CÁC KĨ THUẬT NÂNG CAO CHẤT LƯỢNG ẢNH 1

1.2.1 Biến đổi mức xám 1

1.2.1.1 Biến đổi âm bản 2

1.2.1.2 Biến đổi log 2

1.2.1.3 Biến đổi hàm mũ 3

1.2.1.4 Giãn độ tương phản 3

1.2.1.5 Kĩ thuật cắt theo mức 4

1.2.2 Cân bằng mức xám 5

1.2.3 So sánh mức xám 6

1.2.4 Chèn nhiễu 6

1.2.5 Lọc ảnh 7

1.2.5.1 Lọc làm mịn ảnh 8

a Lọc không gian tuyến tính 8

b Lọc không gian phi tuyến 8

c Lọc trung bình 8

d Lọc thông thấp miền tần số 9

1.2.5.2 Lọc sắc nét ảnh 9

a Lọc thông cao 9

b Lọc tần số từ không gian 10

1.2.5 Các kĩ thuật làm nổi đường biên ảnh 10

1.3 KẾT LUẬN CHƯƠNG 1 11

CHƯƠNG 2 CÁC KĨ THUẬT NÉN ẢNH 12

Trang 4

2.1 TỔNG QUAN VỀ NÉN ẢNH 12

2.1.1 Giới thiệu chung về nén ảnh số 12

2.1.2 Sơ đồ khối hệ thống nén ảnh điển hình 13

2.1.3 Phân loại các kỹ thuật nén 13

2.1.4 Các nguyên tắc khi nén ảnh 14

2.1.5 Dư thừa số liệu 14

2.1.5.1 Dư thừa mã (Coding Redundancy) 15

2.1.5.2 Dư thừa trong pixel ( Interpixel Redudancy) 16

2.1.5.3 Dư thừa tâm sinh lý (Psychovisual Redudancy) 16

2.1.6 Giới thiệu một số kỹ thuật sử dụng trong nén ảnh 17

2.1.6.1 Mã hoá dựa trên phép biến đổi DCT 17

a Biến đổi DCT thuận và nghịch 17

b Lượng tử và giải lượng tử 19

c Mã hóa và giải mã 19

2.1.6.2 Kỹ thuật mã hoá băng con 20

a Ý tưởng mã hoá băng con 20

b Mã hoá băng con 20

2.1.6.3 Biến đổi Wavelet trong nén ảnh 22

a Biến đổi Wavelet 1-D 23

b Biến đổi Wavelet rời rạc 2-D 24

2.1.7 Các tiêu chuẩn nén ảnh 26

2.2 GIỚI THIỆU JPEG VÀ JPEG2000 26

2.2.1 JPEG 26

2.2.1.1 Giới thiệu sơ lược 26

2.2.1.2 Sơ đồ khối 27

2.2.2 JPEG2000 28

2.2.2.1 Giới thiệu sơ lược 28

2.2.2.2 Sơ đồ khối bộ mã hóa và bộ giải mã JPEG 2000 28

2.2.3 So sánh JPEG và JPEG2000 29

CHƯƠNG 3 CHƯƠNG TRÌNH MÔ PHỎNG 32

3.1 NGÔN NGỮ MATLAB 32

Trang 5

3.1.1 Sơ lược lịch sử Matlab 32

3.1.2 Đặc điểm của Matlab và các ứng dụng 34

3.2 CHƯƠNG TRÌNH MÔ PHỎNG SỬ DỤNG MATLAB 35

3.2.1 Giao diện chương trình mô phỏng 35

3.2.2 Nâng cao chất lượng ảnh 36

3.2.2.1 Biến đổi mức xám 36

a Biến đổi mức xám sử dụng hàm imadjust 37

b Biến đổi âm bản 38

c Biến đổi log 39

d Biến đổi hàm mũ 39

e Biến đổi giãn độ tương phản 40

f Kĩ thuật cắt theo mức 41

3.2.2.2 Cân bằng mức xám 41

3.2.2.3 So sánh mức xám 42

3.2.2.4 Chèn nhiễu 43

3.2.2.5 Lọc ảnh 44

a Lọc làm mịn ảnh 45

b Lọc sắc nét ảnh 51

3.2.2.6 Các kĩ thuật làm nổi đường biên ảnh 53

3.2.3 Nén ảnh 54

3.2.3.1 Nén ảnh dùng mã hóa Huffman 54

3.2.3.2 Nén ảnh dùng mã dự đoán không tổn thất 54

3.2.3.3 Nén ảnh JPEG dùng biến đổi DCT 54

3.2.3.4 Nén ảnh JPEG2000 55

KẾT LUẬN 57

TÀI LIỆU THAM KHẢO 58

Trang 6

DANH MỤC HÌNH VẼ

Hình 1.1 Biến đổi âm bản 2

Hình 1.2 Đồ thị hàm log 3

Hình 1.3 Đồ thị hàm mũ 3

Hình 1.4 Biến đổi giãn độ tương phản 4

Hình 1.5 Đồ thị kĩ thuật cắt theo mức 4

Hình 1.6 Biểu đồ hàm s = T(r) 5

Hình 1.7 Cơ chế lọc không gian 7

Hình 1.8 Đường biên của ảnh 10

Hình 2.1 Sơ đồ khối một hệ thống nén ảnh điển hình 13

Hình 2.2 Mô hình mã hóa dự đoán không tổn thất bao gồm bộ mã hóa và bộ giải mã 16 Hình 2.3 Sơ đồ mã hóa và giải mã dùng biến đổi DCT 17

Hình 2.4 Các bước của quá trình mã hóa biến đổi DCT đối với 1 khối 18

Hình 2.5 a) Băng lọc phân tích; b) Hai bộ lọc thông thấp và thông cao c) Phần vùng trong miền tần số; d) Băng lọc tổng hợp 21

Hình 2.6 Sơ đồ khối phân tích tín hiệu mức j 23

Hình 2.7 Sơ đồ biến đổi ngược Wavelet mức j 24

Hình 2.8 Sơ đồ phân tích Wavelet rời rạc 2-D 25

Hình 2.9 Sơ đồ biến đổi ngược Wavelet rời rạc 2-D 25

Hình 2.10 Sơ đồ khối bộ mã hóa và giải mã JPEG dựa trên biến đổi DCT 27

Hình 2.11 Sơ đồ khối bộ mã hóa và bộ giải mã JPEG 2000 28

Hình 2.12 So sánh JPEG, JPEG2000 29

Hình 2.13 Tỉ lệ nén của JPEG2000 và JPEG 30

Hình 2.14 Minh hoạ tính năng ROI 31

Hình 3.1 Giao diện chương trình nâng cao chất lượng và nén ảnh 36

Hình 3.2 Giao diện chương trình biến đổi ảnh xám 37

Hình 3.3 Đồ thị của các giá trị trong hàm imadjust 38

Hình 3.4 Ảnh âm bản 39

Hình 3.5 Ảnh biến đổi hàm log 39

Hình 3.6 Ảnh biến đổi hàm mũ 40

Trang 7

Hình 3.7 Ảnh giãn độ tương phản 40

Hình 3.8 Ảnh cắt theo mức không nền và có nền 41

Hình 3.9 Ảnh cân bằng và biểu đồ 42

Hình 3.10 Hai ảnh xám gần giống nhau 42

Hình 3.11 Ảnh xám thu được trước và sau khi cân bằng 43

Hình 3.12 Ảnh chèn nhiễu salf & pepper 43

Hình 3.13 Giao diện chương trình mô phỏng các phương pháp chèn và lọc nhiễu 44

Hình 3.14 Ảnh lọc sử dụng bộ lọc trung bình 47

Hình 3.15 Ảnh thu được nhờ bộ lọc Laplace có giá trị -4 và -8 ở chính giữa 48

Hình 3.16 Ảnh lọc không gian phi tuyến 49

Hình 3.17 Ảnh lọc trung vị 3x3 50

Hình 3.18 Ảnh lọc trung bình 50

Hình 3.19 Ảnh lọc thông thấp 51

Hình 3.20 Ảnh lọc thông cao cơ bản 51

Hình 3.21 Ảnh lọc emphasis cao tần 52

Hình 3.22 Ảnh lọc tần số từ không gian 53

Hình 3.23 Giao diện nén ảnh JPEG và JPEG2000 55

Trang 8

DANH MỤC BẢNG BIỂU

Bảng 2.1 Số bit mỗi pixel 30Bảng 3.1 Các bộ lọc đặc biệt 45

Trang 9

THUẬT NGỮ VIẾT TẮT

D

DCT Discrete Cosin Transform Biến đổi cosin rời rạc

DFT Discrete Fourier Transform Biến đổi Fourier rời rạc

DWT Discrete Wavelet Transform Biến đổi Wavelet rời rạc

IPT Image Processing Toolbox Hộp công cụ xử lí ảnh

ISO International Organization for

Trang 10

SNR Signal-to-Noise Ratio Tỷ số tín hiệu trên nhiễu

R

RMSE Root Mean Square Error Lỗi trung bình quân phương

Trang 11

LỜI NÓI ĐẦU

Trong nhiều thập kỷ gần đây, cùng với sự tiến bộ của khoa học kỹ thuật, sự pháttriển mạnh mẽ của máy tính và sự ra đời của Internet thì nhu cầu các dịch vụ

dữ liệu truyền trên mạng là rất lớn, nhất là dữ liệu đa phương tiện Ảnh số ra đờikhiến cho nhu cầu của con người về chất lượng ảnh cũng ngày càng tăng cao Conngười sử dụng ảnh số cho nhiều mục đích, nhiều lĩnh vực khác nhau, từ nghệ thuật, yhọc cho tới thiên văn học, địa lý,…Vì vậy ảnh số phải được xử lí sao cho phù hợp vớitừng mục đích cụ thể Xuất phát từ nhu cầu đó của con người, nhiều kỹ thuật xử lí ảnhsố ra đời Xử lí ảnh số mặc dù là một khoa học còn tương đối mới mẻ so với nhiềungành khoa học khác nhất là trên quy mô công nghiệp, song nó đã đem lại nhiều lợiích Xử lí ảnh số bao gồm việc tìm tòi nghiên cứu về các kĩ thuật nén ảnh để đảm bảotiết kiệm băng thông truyền dẫn, giảm bớt không gian lưu trữ để truyền thông tin trênmạng một cách dễ dàng và nhanh chóng Ngoài ra, các thuật toán nhằm nâng cao chấtlượng ảnh cũng là một vấn đề đòi hỏi sự đầu tư nghiên cứu Các thuật toán, các phépbiến đổi nâng cao chất lượng ảnh mà chúng ta đã biết như tạo ảnh âm bản, chèn nhiễu,tăng, giãn độ tương phản, biến đổi logic số học, phép lọc…

Các kỹ thuật nén sử dụng phép biến đổi Fourier (FT), biến đổi cosine rời rạc(DCT), biến đổi Wavelet (DWT) có nhiều ưu điểm không chỉ trong xử lí ảnh màcòn nhiều ứng dụng khác Bằng chứng là sự ra đời của chuẩn nén JPEG (DCT) vàJPEG2000 (dựa trên DWT) đang được sử dụng rất rộng rãi

Với mục tiêu xây dựng chương trình mô phỏng, minh họa cho các kĩ thuật nângcao chất lượng và nén ảnh, em quyết định chọn đề tài này để làm đồ án tốt nghiệp

Đồ án của em chia làm 3 chương:

- Chương 1 giới thiệu tổng quan về ảnh số và các kĩ thuật nâng cao chất lượngảnh như biến đổi ảnh xám, biến đổi âm bản, các phương pháp lọc ảnh nhiễu

- Chương 2 giới thiệu về kĩ thuật nén ảnh và đi sâu vào 2 chuẩn nén ảnh JPEG

và JPEG2000

- Chương 3 giới thiệu tổng quan về ngôn ngữ lập trình Matlab và chương trình

mô phỏng kĩ thuật nâng cao chất lượng và nén ảnh bằng Matlab

Trang 13

CHƯƠNG 1 TỔNG QUAN ẢNH SỐ VÀ CÁC KĨ THUẬT NÂNG CAO CHẤT

Trong chương này, ta tìm hiểu về một số kĩ thuật nâng cao chất lượng ảnh nhưbiến đổi ảnh xám, các phương pháp lọc nhiễu, làm nổi đường biên ảnh Các kĩ thuậtnày hiện nay đang được ứng dụng rộng rãi trong nhiều lĩnh vực

1.1 Tổng quan về ảnh số

Hình ảnh tĩnh có thể được biểu diễn bởi hàm 2 chiều f(x,y), trong đó x và y là tọa

độ không gian phẳng (2 chiều) Khi xét ảnh “đen-trắng”, giá trị hàm f tại một điểmđược xác định bởi tọa độ (x, y) được gọi là độ chói (mức xám) của ảnh tại điểm này.Nếu x, y và f là các giá trị rời rạc, ta gọi ảnh đó là ảnh số Xử lí ảnh số là quá trình biếnđổi ảnh số trên máy tính Như vậy, ảnh số được tạo ra bởi một số hữu hạn các điểmảnh, mỗi điểm ảnh nằm tại một vị trí nhất định và có một giá trị nhất định Một điểmảnh trong một ảnh còn được gọi là một pixel

1.2 Các kĩ thuật nâng cao chất lượng ảnh

Hệ thống thị giác là cơ quan cảm nhận hình ảnh quang học tương đối hoàn hảo,cho phép con người cảm nhận được hình ảnh quang học trong thiên nhiên Ứng dụngquan trọng nhất của nâng cao chất lượng ảnh là biến đổi tính chất của ảnh số nhằm tạocảm nhận về sự gia tăng chất lượng hình ảnh quang học

1.2.1 Biến đổi mức xám

Hàm biến đổi mức xám có công thức như sau:

Trang 14

trong đó r: mức xám ảnh vào f(x, y)

s: mức xám ảnh ra g(x, y)

T: hàm biến đổi mức xám

1.2.1.1 Biến đổi âm bản

Âm bản của một ảnh có các mức xám trong khoảng [0, L-1] được tạo ra nhờ phépbiến đổi âm Phép biến đổi này ứng dụng rất nhiều trong các phim ảnh trong y học.Hàm sử dụng trong ảnh âm bản như sau:

trong đó L: mức xám cao nhất

u: mức xám của ảnh vào

f(u): hàm biến đổi mức xám của ảnh vào

Hình 1.1 Biến đổi âm bản [7]

Phép biến đổi này phù hợp cho việc nâng cao các chi tiết trắng hoặc xám nằmtrong vùng tối của ảnh, đặc biệt là khi vùng tối chiếm phần lớn kích thước ảnh

1.2.1.2 Biến đổi log

Các biến đổi log được thực hiện bằng cách sử dụng công thức:

trong đó r: mức xám ảnh vào

c: hằng số

s: mức xám ảnh ra

Trang 15

Hình 1.2 Đồ thị hàm log 1.2.1.3 Biến đổi hàm mũ

Phép biến đổi theo hàm mũ có công thức cơ bản như sau:

trong đó r: mức xám ảnh vào

s: mức xám ảnh ra

c và : các hằng số dương

Hình 1.3 Đồ thị hàm mũ

1.2.1.4 Giãn độ tương phản

Hàm biểu diễn trong hình 1.4 được gọi là một hàm biến đổi giãn độ tương phản bởi vì nó nén các mức đầu vào thấp hơn m thành một khoảng hẹp các mức tối trên ảnh ra; tương tự, nó nén các giá trị phía trên m thành một băng hẹp các mức sáng trên đầu

ra Kết quả ra là một ảnh có độ tương phản cao hơn

Trang 16

Hình 1.4 Biến đổi giãn độ tương phản 1.2.1.5 Kĩ thuật cắt theo mức

Kỹ thuật này dùng 2 phép ánh xạ khác nhau cho trường hợp có nền và không nền

b u a khi L u

0 )

Đồ thị tương ứng của các hàm này như sau:

Hình 1.5 Đồ thị kĩ thuật cắt theo mức

Biến đổi này cho phép phân đoạn một số mức xám từ phần còn lại của ảnh Nó cótác dụng khi nhiều đặc tính khác nhau của ảnh nằm trên nhiều miền mức xám khácnhau

1.2.2 Cân bằng mức xám

Ảnh có mức xám từ [0, L-1] sẽ có biểu đồ mức xám là:

Trang 17

h(rk) = nk (1.7) [2]

với rk là mức xám thứ k và nk là số pixel trong ảnh có cùng mức xám là rk

Có thể chuẩn hóa bằng cách chia nk cho tổng số pixel của cả ảnh Biểu đồ chuẩnhóa sẽ là: p(rk)= nk/n, n là tổng số pixel của cả ảnh p(rk) phản ánh xác suất xuất hiệncủa mức xám rk Chú ý là tổng các thành phần biểu đồ chuẩn hóa phải bằng 1

Biểu đồ có thể coi là phản ánh xấp xỉ xác suất xuất hiện của các giá trị mức xámtrong ảnh Biểu đồ chính là nền tảng của đa số kỹ thuật xử lí miền không gian, còn cóthể sử dụng cho các kỹ thuật nén ảnh, phân rã ảnh… Vận dụng biểu đồ có hiệu quả rấttốt đối với nâng cao chất lượng ảnh

Đối với các ảnh có mức xám quá tập trung ở vùng tối hoặc vùng trắng, chúng tacó thể sử dụng phương pháp cân bằng mức xám của ảnh để phân tán biểu đồ xám

Ta định nghĩa hàm s như sau bằng T(r), r thuộc [0, 1] thỏa mãn các điều kiện sau:

- T(r) đơn trị và đơn điệu tăng trên [0, 1] (a)

với s và T(r) là mức xám ảnh ra và biến đổi T của mức xám ảnh vào

Điều kiện (a) để đảm bảo tồn tại quá trình biến đổi ngược và điều kiện đơn điệutăng để đảm bảo ảnh sau khi biến đổi không bị thay đổi thứ tự mức xám (trắng thànhđen và ngược lại)

Hình 1.6 Biểu đồ hàm s = T(r)

Với pr(w) là xác suất của mức xám w:

s = T(r) = r p r w dw

Trang 18

Với trường hợp r là rời rạc (tín hiệu số), ta có:

j

r r p

0

) (



k j

k n

n

0 k = 0, 1, 2, , L – 1 (1.10) [2]

Kết quả của quá trình biến đổi này là ảnh ra có phân bố biểu đồ đồng đều.Phương pháp này gọi là cân bằng biểu đồ

1.2.3 So sánh mức xám

Có những ảnh khi quan sát ta khó có thể phân biệt được sư khác nhau giữa haiảnh xám Để có thể so sánh hai ảnh một cách rõ ràng chúng ta có thể sử dụng phép trừhai ảnh này cho nhau: mức xám của điểm ảnh thu được sẽ bằng mức xám của điểmảnh trên ảnh thứ nhất trừ cho mức xám trên điểm ảnh thứ hai Kĩ thuật này thườngđược dùng trong dự báo thời tiết và trong y học

1.2.4 Chèn nhiễu

Khi truyền ảnh đi trên một kênh truyền nào đó thì sẽ có ảnh hưởng của nhiễu,việc loại bỏ nhiễu sẽ đưa ra ảnh có chất lượng cao hơn Thông thường, người ta xétđến 3 loại nhiễu chính:

• Nhiễu cộng: Nhiễu cộng thường phân bố khắp ảnh Nếu gọi ảnh quan sát (ảnh

thu được) là Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu được có thể biểu diễn bởi:

Trang 19

gian và lọc tần số Lọc trong miền không gian là nhân chập một ảnh xám f(x, y) với 1mặt nạ lọc h(x, y) (là một ma trận H kích thước nhỏ) để tạo ra ảnh mới Trên thực tế,tích chập không gian thường được đơn giản hóa bằng cách sử dụng các mặt nạ nhỏ,giữ lại các đặc điểm nổi bật của các ảnh Với f(x, y) là ảnh vào, g(x, y) là ảnh ra, h(x,y) là mặt nạ lọc, ta có:

Ta cũng có thể làm tương tự trong miền tần số bằng cách nhân F(u, v) với H(u,v), đây chính là biến đổi Fourier của lọc không gian Người ta thường gọi H(u, v) làhàm truyền đạt Tùy thuộc ma trận sử dụng mà ta nhận được các kết quả khác nhau

với F(u, v), G(u, v) là biến đổi Fourier của ảnh vào và ảnh ra, H(u, v) là hàm truyền đạtcủa bộ lọc

Hình 1.7 Cơ chế lọc không gian 1.2.5.1 Lọc làm mịn ảnh

Ý tưởng của phương pháp lọc làm mịn là thay giá trị của một pixel bằng giá trịmức xám trung bình của các pixel trong mặt nạ Phương pháp này sẽ giúp loại bỏ các

Trang 20

chi tiết không liên quan trước khi thực hiện tách các đối tượng trong ảnh Chi tiết ởđây là nhóm các pixel có kích thước rất nhỏ so với mặt nạ Tuy nhiên phương phápnày tạo ra tác dụng không mong muốn là làm giảm độ nét của ảnh.

a Lọc không gian tuyến tính

Lọc không gian tuyến tính là quá trình lọc mà c ác phép toán thực hiện trên cácpixel của các vùng lân cận là tuyến tính

Với lọc tuyến tính, đáp ứng được đưa ra bởi phép cộng các hệ số của bộ lọc nhânvới pixel ảnh tương ứng trong vùng được quét bởi mặt nạ

Ví dụ cho lọc tuyến tính với mặt nạ 3x3, đáp ứng R tại điểm (x,y):

R = w(- 1, - 1) f(x - 1, y - 1) + w(- 1, 0) f(x - 1, y) +…+ w(0, 0) f(x, y) + +

b Lọc không gian phi tuyến

Đối với lọc phi tuyến thì giá trị của đáp ứng R không đơn thuần là tổng của cáctích của hệ số bộ lọc với các giá trị pixel tương ứng, mà nó còn phụ thuộc vào bản thângiá trị của các pixel

Lọc thống kê thứ tự là lọc phi tuyến trong đó đáp ứng R của bộ lọc được tạo radựa trên thứ tự của các pixel trong vùng được quét bởi mặt nạ

Điển hình cho loại này là lọc trung vị Giống như tên gọi của nó, trong phép lọctrung vị, giá trị mức xám của pixel sẽ được thay thế bởi mức xám trung bình của cácpixel lân cận nó Phương pháp này được sử dụng khá phổ biến để giảm nhiễu, đặc biệt

là loại nhiễu xung (impulse noise hay còn gọi là saft-and-pepper noise)

c Lọc trung bình

Do có nhiều loại nhiễu can thiệp vào quá trình xử lí ảnh nên cần có nhiều bộ lọcthích hợp Trường hợp tổng quát có thể dùng phương pháp lọc trung bình với các bộlọc có kích thước khác nhau, mỗi điểm ảnh được thay thế bằng trung bình trọng số củacác điểm lân cận và được định nghĩa như sau:

v(m, n) = (k,l)e W a(k,l)y(m k,n l) (1.16) [7]

Nếu trong kỹ thuật lọc trên, ta dùng các trọng số như nhau, phương trình trên sẽtrở thành:

Trang 21

v(m, n) = N1 (k,l)e W y(m k,n l) (1.17) [7]

với y(m, n) là ảnh đầu vào, v(m, n) là ảnh đầu ra và a(k, l) là cửa sổ lọc, ak,l = 1/Nw và

Nw là số điểm ảnh trong cửa sổ lọc W

d Lọc thông thấp miền tần số

Về cơ bản, ý tưởng lọc trong miền tần số là lựa chọn một hàm truyền đạt để nhânvới F(u, v), tạo ra một ảnh mới Ví dụ, ta có một hàm truyền đạt mà khi nhân hàm nàyvới một F(u, v) trung tâm sẽ làm suy giảm các thành phần cao tần của F(u, v), trongkhi đó việc loại bỏ các tần số thấp gần như không thay đổi

1.2.5.2 Lọc sắc nét ảnh

Mục đích của lọc làm sắc nét ảnh là làm nổi bật các chi tiết nhỏ hoặc chi tiết bị

mờ, có thể do nhiễu hoặc do quá trình thu nhận ảnh Các kĩ thuật lọc làm sắc nét đều làlọc miền tần số

a Lọc thông cao

Lọc thông thấp làm mờ một ảnh, ngược lại, lọc thông cao lọc sắc nét ảnh nhờ làmsuy giảm các thành phần tần thấp và loại bỏ gần hết các thành phần cao tần của biếnđổi Fourier

Lọc thông cao cơ bản

Cho hàm truyền đạt Hlp(u, v) của 1 bộ lọc thông thấp, ta thu được hàm truyền đạtcủa bộ lọc thông cao tương ứng nhờ sử dụng:

Lọc emphasis cao tần

Các bộ lọc thông cao như trên sẽ làm giảm giá trị trung bình của ảnh tới 0 Như tađã thấy ở trên, ảnh lọc nét hơn nhưng lại tối hơn nhiều so với ảnh gốc Một phươngpháp giải quyết vấn đề này là chèn thêm vào một offset để lọc thông cao Khi offset

kết hợp với việc nhân bộ lọc với một số lớn hơn 1 thì phương pháp này được gọi là lọc

emphasis cao tần bởi vì phép nhân làm nổi rõ các tần số cao

Emphasis cao tần có hàm truyền đạt:

Trang 22

trong đó a là offset, b là số nhân và Hhp(u, v) là hàm truyền đạt của bộ lọc thông cao.

Để có kết quả lọc cao hơn, sau khi lọc emphasis cao tần ta nên sử dụng phương pháp

cân bằng biểu đồ

b Lọc tần số từ không gian

Thông thường, lọc trong miền không gian có hiệu suất tính toán cao hơn lọc miền

tần số khi các bộ lọc nhỏ Định nghĩa nhỏ khá phức tạp, nó phụ thuộc vào các hệ số

lọc, kích thước của bộ đệm, các dữ liệu phức hợp được xử lí như thế nào Tuy nhiên,khi đem ra so sánh, ta thấy bộ lọc sử dụng thuật toán FFT có thể nhanh hơn là một bộlọc trong miền không gian Do đó, người ta nhận thấy nên chuyển lọc không gianthành kĩ thuật lọc miền tần số tương đương chứa ưu điểm của cả hai phương pháp này

1.2.5 Các kĩ thuật làm nổi đường biên ảnh

Làm nổi biên ảnh là vấn đề quan trọng trong phân tích ảnh Trước hết, ta cần tìmhiểu về khái niệm biên ảnh Một điểm ảnh được coi là nằm trên đường biên nếu tại vịtrí điểm ảnh đó có sự thay đổi đột ngột của mức xám Như vậy, đường biên là đườngnối các điểm ảnh nằm trong khu vực ảnh có thay đổi đột ngột về độ chói, đường biênthường ngăn cách hai vùng ảnh có các mức xám gần như không đổi

Hình 1.8 Đường biên của ảnh

Trong trường hợp lí tưởng, độ chói giữa hai vùng ảnh thay đổi đột ngột hoặc tăngdần đều Tuy nhiên trên thực tế, mức xám giữa các vùng ảnh thay đổi tương đối ngẫunhiên Chính vì vậy quá trình phát hiện đường biên thường không đơn giản và kết quảthường không hoàn toàn chính xác

1.3 Kết luận chương 1

Kết thúc chương 1, một số kĩ thuật nâng cao chất lượng ảnh như biến đổi ảnhxám (biến đổi âm bản, biến đổi hàm log, hàm mũ), lọc nhiễu (lọc thông thấp, thôngcao, lọc phi tuyến, tuyến tính, lọc trung vị,…), làm nổi biên ảnh đã được đề cập đến

Trang 23

Trên thực tế, nâng cao chất lượng ảnh còn rất nhiều vấn đề đáng chú ý khác như các kĩthuật làm trơn ảnh, tách nhiễu, khử nhiễu, làm trơn biên, khuếch đại ảnh, lọc đồnghình, lọc ngoài, lọc giả trung vị

Trang 24

CHƯƠNG 2 CÁC KĨ THUẬT NÉN ẢNH

Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet thì việctìm một phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin và truyềnthông tin trên mạng nhanh chóng đang là một yêu cầu cấp thiết Trong những năm gầnđây, có rất nhiều các phương pháp đã và đang được nghiên cứu rộng rãi để thực hiệnnén ảnh Tất cả đều với một mục đích chung là làm thế nào để biểu diễn một ảnh với ítbit nhất để có thể tối thiểu hoá dung lượng kênh truyền và không gian lưu trữ trong khivẫn giữ được tính trung thực của ảnh Điều này tương đương với việc biểu diễn ảnh có

độ tin cậy cao nhất với tốc độ bit nhỏ nhất

2.1 Tổng quan về nén ảnh

2.1.1 Giới thiệu chung về nén ảnh số

Thông thường, ảnh đen trắng chưa nén được biểu diễn bằng 8 bit/pixel và ảnhmàu là 24 bit/pixel Các kỹ thuật nén hiện nay cho phép dung lượng ảnh được néngiảm 30 đến 50 lần so với ảnh gốc mà ảnh vẫn giữ được độ trung thực cao Độ trungthực của ảnh được đánh giá dựa trên tiêu chí như lỗi trung bình quân phương (MSE)hoặc tỷ số tín hiệu trên nhiễu (SNR) giữa ảnh gốc và ảnh nén

Những phương pháp thường (như Compress trong hệ UNIX) không đem lại hiệuquả: tỷ lệ nén dữ liệu cho hình ảnh không quá 2:1 Nhưng với những phương phápchuyên dụng có thể đạt tới 30:1 Hai phương pháp nén hình ảnh nổi tiếng nhất hiệnnay là của nhóm chuyên gia về hình ảnh động (Motion Picture Experts Group -MPEG) và liên hiệp các nhóm chuyên gia về hình ảnh (Joint Photo Graphic ExpertsGroup - JPEG) Những phương pháp này đã trở thành chuẩn công nghiệp Nhữngnhược điểm cơ bản của các phương pháp này là sự mất mát thông tin và hiệu quả nénkhông cao đối với những hình ảnh phức tạp

Tất cả các phương pháp nén ảnh đều dựa trên một nguyên lý đơn giản: trong dữliệu có nhiều phần tử thừa và nén ảnh dựa trên cơ sở tìm ra những phần tử đó và loạibỏ chúng

Trang 25

Các phương pháp thông dụng hiện nay như biến đổi cosin rời rạc, nén ảnhWavelet (WIC) phải dùng đến biến đổi toán học và xấp xỉ các mối tương quan giữacác pixel Với các phương pháp này ta có thể nén ảnh tới tỷ lệ 20:1 – 30:1 Nhưngnhững ảnh này (vì bị mất thông tin) chỉ là những ảnh gần đúng với ảnh ban đầu, ngoài

ra còn có thể xuất hiện biến dạng hình ảnh

2.1.2 Sơ đồ khối hệ thống nén ảnh điển hình

Hình 2.1 Sơ đồ khối một hệ thống nén ảnh điển hình

- Khối biến đổi: Thường dùng phép biến đổi cosin rời rạc để tập trung năng lượng tínhiệu vào một số lượng nhỏ các hệ số khai triển để thực hiện phép nén hiệu quả hơn làdùng tín hiệu nguyên thủy

- Khối lượng tử: Tạo ra một lượng kí hiệu giới hạn cho ảnh nén với hai kĩ thuật:lượng tử vô hướng (thực hiện lượng tử hóa cho từng phần dữ liệu) và lượng tử vector(thực hiện lượng tử hóa một lần một khối dữ liệu) Quá trình này không thuận nghịch

- Khối mã hóa: Gán một từ mã, một dòng bit nhị phân cho mỗi kí hiệu, số nguyêngần nhất

2.1.3 Phân loại các kỹ thuật nén

Có nhiều cách phân loại các phương pháp nén khác nhau Cách thứ nhất dựa vàonguyên lý nén Cách này phân các phương pháp nén thành hai họ lớn:

giải nén ta khôi phục được chính xác ảnh gốc Các phương pháp nén này bao gồm mãhoá Huffman, mã hoá thuật toán…

- Nén ảnh có mất thông tin (nén có tổn hao): Ảnh giải nén có một sự sai khác nhỏ sovới ảnh gốc Các phương pháp này bao gồm:

 Mã hoá biến đổi: biến đổi cosin rời rạc (DCT), biến đổi Fourier nhanh(FFT)

Trang 26

 Mã hoá băng con.

Ngoải ra, ta có thể phân loại dựa vào cách thức thực hiện nén Theo cách này,người ta cũng phân thành hai họ: Phương pháp nén dữ liệu không gian và phươngpháp sử dụng mã hóa biến đổi Hoặc cũng có thể phân loại dựa vào lý thuyết mã hóa.Cách này cũng phân các phương pháp nén thành hai họ: Các phương pháp nén thế hệthứ nhất (gồm các phương pháp mà mức độ tính toán là đơn giản, thí dụ việc lấy mẫu,gán từ mã, ) và các phương pháp nén thế hệ thứ hai (dựa vào độ bão hòa của tỷ lệnén)

2.1.4 Các nguyên tắc khi nén ảnh

Một tính chất chung nhất của tất cả các ảnh số đó là tương quan giữa các pixel ởcạnh nhau lớn, điều này dẫn đến dư thừa thông tin để biểu diễn ảnh Dư thừa thông tin

sẽ làm cho việc mã hoá không tối ưu Do đó công việc cần làm để nén ảnh là phải tìmđược các biểu diễn ảnh với tương quan nhỏ nhất để giảm thiểu độ dư thừa thông tincủa ảnh Thực tế, có hai kiểu dư thừa thông tin được phân loại như sau:

- Dư thừa trong miền không gian: tương quan giữa các giá trị pixel của ảnh, điều nàycó nghĩa rằng các pixel lân cận của ảnh có giá trị gần giống nhau (trừ những pixel ởgiáp đường biên ảnh)

- Dư thừa trong miền tần số: Tương quan giữa các mặt phẳng màu hoặc dải phổ khácnhau

Trọng tâm của các nghiên cứu về nén ảnh là tìm cách giảm số bit cần để biểudiễn ảnh bằng việc loại bỏ dư thừa trong miền không gian và miền tần số càng nhiềucàng tốt

2.1.5 Dư thừa số liệu

Nén số liệu là quá trình giảm lượng số liệu cần thiết để biểu diễn cùng một lượngthông tin cho trước Cần phải phân biệt giữa số liệu và thông tin Thực tế, số liệu vàthông tin không đồng nghĩa với nhau Số liệu (tín hiệu) chỉ là phương tiện dùng đểtruyền tải thông tin Cùng một lượng thông tin cho trước có thể biểu diễn bằng cáclượng số liệu khác nhau

Trong nén ảnh số, có ba loại dư thừa số liệu có thể được nhận dạng và phân biệt

Trang 27

2.1.5.1 Dư thừa mã (Coding Redundancy)

Nếu các mức của tín hiệu video được mã hóa bằng các symbol nhiều hơn cầnthiết (tuyệt đối) thì kết quả là có độ dư thừa mã Để giảm độ dư thừa mã, trong nén ảnhthường sử dụng các mã VLC như mã Huffman, mã RLC Lượng thông tin về hìnhảnh có xác suất thấp hơn

Nguyên lý cơ bản của việc nén ảnh này là các từ mã có độ dài biến đổi, cho phépgán các từ mã ngắn nhất cho các mức xám có tần suất xuất hiện nhiều nhất trong ảnh.Câu hỏi được đặt ra là: Cần bao nhiêu bit để thay thế cho các mức xám trong một ảnh.Đó là, liệu có tồn tại dữ liệu nhỏ đủ để mã hóa đầy đủ một ảnh mà không gây ra tổnthất?

Ý tưởng này là khởi đầu cho việc thông tin có thể được xử lí giống như cách xử líxác suất Với giả định này, một sự kiện ngẫu nhiên E với xác suất P(E) có chứa lượngthông tin:

I(E) = log P(1E) = – log P(E) (2.1) [2]

Nếu P(E) = 1 (sự kiện luôn luôn đúng) thì I(E) = 0 và không có thông tin nàotrong nó Vì không có sự không chắc chắn nào liên quan tới sự kiện nên sẽ không cóthông tin được truyền tải thông báo rằng sự kiện đó đã xảy ra Cho một tập hợp các sựkiện ngẫu nhiên gốc rời rạc {a1, a2, …, aj} có xác suất tương ứng là {P(a1), P(a2), …,P(aj)}, lượng thông tin trung bình trên mỗi đầu ra (hay còn gọi là entropy) là:

H = – 



J j

j

a P

1

) ( log )

Nếu một ảnh nhận được là một mẫu “nguồn mức xám”, chúng ta có thể mô hìnhhóa các xác suất kí hiệu của nguồn bằng cách sử dụng một ma trận mức xám của ảnhnày và tính toán giá trị xấp xỉ (gọi là xấp xỉ thứ tự ưu tiên: first-order estimate) củaentropy gốc:

~



L k

k r k

P

1

)(log)

Giá trị xấp xỉ được tính toán bởi hàm entropy (với giả thiết mỗi mức xám đượcmã hóa độc lập) có biên thấp hơn nhờ việc loại bỏ dư thừa mã

Trang 28

2.1.5.2 Dư thừa trong pixel ( Interpixel Redudancy)

Vì giá trị của một pixel bất kì nào đó cũng có thể được dự báo từ giá trị của cáclân cận của nó, nên thông tin từ các pixel riêng là tương đối nhỏ Sự tham gia của mộtpixel riêng vào một ảnh là dư thừa Nhiều tên (bao gồm: dư thừa không gian, dư thừahình học, dư thừa trong ảnh) được đặt ra để phân biệt sự phụ thuộc này của các pixel

Ta dùng độ dư thừa trong pixel để chỉ tất cả các tên trên Để giảm độ dư thừa trongpixel của một ảnh, dãy pixel hai chiều dùng cho việc nhìn và nội suy, phải được biếnđổi thành một dạng có hiệu quả hơn

Người ta đưa ra một phương pháp gọi là mã hóa dự đoán không tổn thất để loại

bỏ các dư thừa trong pixel của các pixel kề nhau bằng cách chỉ đưa ra và mã hóa thôngtin mới trong mỗi pixel “Thông tin mới” của 1 pixel là sự khác biệt giữa giá trị thực tế

và giá trị dự đoán của pixel đó

Hình 2.2 Mô hình mã hóa dự đoán không tổn thất bao gồm bộ mã hóa và bộ giải mã 2.1.5.3 Dư thừa tâm sinh lý (Psychovisual Redudancy)

Bằng trực quan ta thấy, sự thu nhận cường độ ánh sáng thay đổi chỉ giới hạntrong một phạm vi nhất định Hiện tượng này xuất phát từ sự thật là mắt không đápứng với cùng độ nhạy của tất cả các thông tin nhìn thấy Thông tin đơn giản có tầmquan trọng ít hơn thông tin khác trong vùng nhìn thấy Thông tin này được gọi là độ dưthừa tâm sinh lý Nó có thể được loại bỏ mà không ảnh hưởng đáng kể đến chất lượng

Trang 29

thu nhận ảnh Khác với độ dư thừa mã và dư thừa trong pixel, độ dư thừa tâm sinh lýcó liên quan đến thông tin theo định lượng Quá trình loại bỏ nó là đáng kể bởi vìthông tin của nó không cần thiết cho quá trình xử lí thị giác chuẩn Dư thừa tâm sinh lícó quan hệ tới việc lượng tử hóa Điều đó có nghĩa là ánh xạ một khoảng rộng các giátrị đầu vào lên một số hữu hạn các giá trị đầu ra Khi nó là toán tử không đảo ngược(mất thông tin) cho kết quả nén số liệu có tổn hao.

2.1.6 Giới thiệu một số kỹ thuật sử dụng trong nén ảnh

2.1.6.1 Mã hoá dựa trên phép biến đổi DCT

Nguyên tắc chính của phương pháp mã hoá này là biến đổi tập các giá trị pixelcủa ảnh trong miền không gian sang một tập các giá trị khác trong miền tần số sao chocác hệ số trong tập giá trị mới này có tương quan giữa các điểm ảnh gần nhau nhỏ hơn

Hình 2.3 Sơ đồ mã hóa và giải mã dùng biến đổi DCT [4]

a Biến đổi DCT thuận và nghịch

Vì ảnh gốc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT, ảnhđược phân chia thành các khối vuông, mỗi khối này thường có kích thước 8 x 8 pixel

và biểu diễn các mức xám của 64 điểm ảnh, các mức xám này là các số nguyên dươngcó giá trị từ 0 đến 255 Việc phân khối này sẽ làm giảm được một phần thời gian tínhtoán các hệ số chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ làm tăng độchính xác khi tính toán với dấu phẩy tĩnh, giảm thiểu sai số do làm tròn sinh ra

Biến đổi DCT là một công đoạn chính trong các phương pháp nén sử dụng biếnđổi Hai công thức ở đây minh hoạ cho 2 phép biến đổi DCT thuận nghịch đối với mỗi

Trang 30

khối ảnh có kích thước 8 x 8 Giá trị x(n1, n2) biểu diễn các mức xám của ảnh trongmiền không gian, X(k1, k2) là các hệ số sau biến đổi DCT trong miền tần số.

Hình 2.4 Các bước của quá trình mã hóa biến đổi DCT đối với 1 khối [4]

Trang 31

Chú ý rằng bản thân biến đổi DCT không làm mất thông tin vì DCT là một biếnđổi tuyến tính chuyển các giá trị của điểm ảnh từ miền không gian thành các hệ sốtrong miền tần số Nếu biến đổi DCT thuận và nghịch được tính toán với độ chính xáctuyệt đối và nếu các hệ số DCT không phải qua bước lượng tử và mã hoá thì ảnh thuđược sau biến đổi DCT ngược sẽ giống hệt ảnh gốc.

b Lượng tử và giải lượng tử

Sau khi thực hiện biến đối DCT, 64 hệ số sẽ được lượng tử hoá dựa trên một

bảng lượng tử gồm 64 phần tử Q(u,v) với 0 ≤ u, v ≤ 7 Bảng này được định nghĩa bởi

từng ứng dụng cụ thể Các phần tử trong bảng lượng tử có giá trị từ 1 đến 255 đượcgọi là các bước nhảy cho các hệ số DCT Quá trình lượng tử được coi như là việc chiacác hệ số DCT cho bước nhảy lượng tử tương ứng, kết quả này sau đó sẽ được làm

tròn xuống số nguyên gần nhất Công thức (2.6) thể hiện việc lượng tử với F(u,v) là các hệ số DCT, F Q (u,v) là các hệ số sau lượng tử, các hệ số này sẽ được đưa vào bộ mã

) , (

v u Q

v u F

Mục đích của việc lượng tử hoá là giảm số lượng bit cần để lưu trữ các hệ số biếnđổi bằng việc giảm độ chính xác của các hệ số này cho nên lượng tử là quá trình xử lícó mất thông tin

Quá trình giải lượng tử ở phía bộ giải mã được thực hiên ngược lại Các hệ số sau

bộ giải mã entropy sẽ nhân với các bước nhảy trong bảng lượng tử (bảng lượng tửđược đặt trong phần mào đầu của ảnh JPEG) Kết quả này sau đó sẽ được đưa vào biếnđổi DCT ngược

c Mã hóa và giải mã

Mã hoá là bước cuối cùng trong hệ thống nén ảnh dựa trên biến đổi DCT Chuẩnnén ảnh JPEG hiện nay dùng phương pháp mã hoá Huffman, đây là phép mã hoákhông làm mất thông tin Phương pháp này dựa trên mô hình thống kê Dựa vào dữliệu gốc, người ta tính tần suất xuất hiện các hệ số Việc tính tần suất được thực hiệnbằng cách duyệt tuần tự từ đầu khối đến cuối khối, sau đó, những hệ số có tần suất caođược gắn cho một từ mã ngắn, các hệ số có tần suất thấp được gán một từ mã dài Vớicách thức này chiều dài trung bình của từ mã đã giảm xuống

Trang 32

Các hệ số thu được sau khi lượng tử hoá sẽ được sắp xếp thành một chuỗi các kýhiệu theo kiểu “zig-zag” (theo đường zig-zag trong hình 2.4) để đặt các hệ số có tần sốthấp lên trước các hệ số tần số cao Các hệ số này sẽ được mã hoá dựa trên bảng mãHuffman sao cho chiều dài trung bình của từ mã là nhỏ nhất Bảng mã này cũng sẽđược đặt trong phần mào đầu của ảnh để thực hiện giải nén ảnh.

2.1.6.2 Kỹ thuật mã hoá băng con

a Ý tưởng mã hoá băng con

Mặc dù với tất cả các ưu điểm của nén ảnh JPEG dựa trên biến đổi DCT như:tính toán đơn giản, chất lượng tốt và dễ dàng thực hiện về mặt phần cứng Nhưngphương pháp này cũng không hẳn là không có nhược điểm Vì ảnh đầu vào được phânchia thành nhiều khối độc lập, các khối này được thực hiện biến đổi DCT riêng chonên vẫn có tương quan ở dọc đường biên của các khối Điều này sẽ gây ra lỗi khối khithực hiện mã hoá với tốc độ bit thấp Trong một ảnh số, các thành phần tần số cao chủyếu tập trung ở vùng biên của ảnh, đấy là nơi mà các giá trị mức xám của các điểm ảnhcó độ chênh lệch lớn Mà trong đa số các ảnh, các chi tiết của ảnh thường thay đổichậm tức là chênh lệch mức xám giữa các điểm ảnh gần nhau nhỏ Như vậy có thể kếtluận rằng phổ tần của ảnh tập trung chủ yếu ở miền tần số thấp Trong các phươngpháp nén ảnh trước đây, việc mã hoá thực hiện trong toàn dải tần của ảnh, như vậy sẽgây dư thừa thông tin khi mã hoá trong miền tần số cao vì ở tần số cao không có nhiềuthông tin của ảnh Vì vậy, cần thiết phải đưa ra một phương pháp mới tối ưu hơn

Ý tưởng của phương pháp mã hoá băng con là chia dải tần số của ảnh thành nhiềudải tần con và mã hoá ở mỗi dải tần một số lượng bit khác nhau Ví dụ, ở dải tần sốcao số bit mã hoá sẽ không cần nhiều bằng ở miền tần số thấp Với phương pháp nàyhiệu quả nén sẽ tăng lên và nhiều khối cũng không xuất hiện nữa do không phải phânchia ảnh thành các khối để xử lí

b Mã hoá băng con

Nguyên tắc cơ bản trong quá trình mã hoá ảnh băng con là phân chia ảnh thànhnhiều dải tần số thông qua các bộ lọc thông thấp, thông dải và thông cao Các dải tầnnày gọi là các băng con Sau đó, các băng con này sẽ được lượng tử và mã hoá độc lậpnhau, tuỳ thuộc vào tính chất thống kê và mật độ năng lượng của từng dải mà số bit mãhoá khác nhau

Trang 33

Hình 2.5 a) Băng lọc phân tích; b) Hai bộ lọc thông thấp và thông cao

c) Phần vùng trong miền tần số; d) Băng lọc tổng hợp

Minh họa trên hình 2.5 (a) Gọi L và H tương ứng là các bộ lọc thông thấp vàthông cao một chiều Tần số 2 chiều của ảnh được tách ra từng chiều theo trục w1 vàw2 Hình 2.5 (c) mô tả băng lọc được phân thành 4 vùng tần số LL, LH, HL và HH.Vùng trung tâm (LL) là vùng có tần số thấp theo cả hai hướng Bốn góc (HH) là vùngcó các thành phần tần số cao theo cả hai hướng Bốn vùng bên cạnh (HL, LH) là cácvùng có tần số thấp và tần số cao, mỗi thành phần đi theo một hướng Chú ý đến các

hệ số 2 trong hình vẽ 2.5 (a), đó là thành phần giảm mẫu, nó có nhiệm vụ kéo dãnbăng tần của từng băng con để bằng với băng tần của ảnh gốc nhưng với tốc độ lấymẫu thấp hơn

Các vùng tần số gọi là các băng con sẽ được lượng tử hoá và mã hoá giống nhưvới biến đổi DCT Sau khi lượng tử, mã hoá, lưu trữ, truyền và giải mã ảnh, mỗi băngcon sẽ được tăng mẫu với hệ số 2 (hình 2.5 (d)) và thông qua các bộ lọc để loại bỏ các

Trang 34

thành phần chồng phổ (alias) của tín hiệu sinh ra do các bộ tăng mẫu Tất cả các băngnày sau đó được cộng lại để khôi phục lại ảnh ban đầu.

Trong thực tế, rất nhiều lỗi được tạo ra trong quá trình nén và truyền ảnh: lỗi dolượng tử hoá, do mã hoá, lỗi kênh truyền… bên cạnh đó, bản thân băng lọc còn gây ralỗi do phía thu không khôi phục lại được chính xác tín hiệu phát Do đó, nếu khôngquan tâm đến sự có mặt của các bộ mã hoá và kênh truyền thì trước tiên băng lọc phảicó tính khôi phục hoàn hảo tức là tín hiệu ra phải là một bản trễ nguyên gốc của tínhiệu đầu vào Điều này phụ thuộc vào việc thiết kế các bộ lọc trong băng lọc Có rấtnhiều các nghiên cứu để tìm ra các băng lọc thoả mãn tính khôi phục hoàn hảo Mộttrong những dạng như vậy là băng lọc gương cầu phương QMF (Quadrature MirrorFilter) với bộ lọc thông cao (H) là ảnh gương của bộ lọc thông thấp (L) qua trục П/2(hình 2.5 (b))

2.1.6.3 Biến đổi Wavelet trong nén ảnh

Biến đổi Wavelet

Wavelet là phép biến đổi được sử dụng để phân tích các tín hiệu không ổn định(non-stationary) – là những tín hiệu có đáp ứng tần số thay đổi theo thời gian

Biến đổi Wavelet được thực hiện theo cách: tín hiệu được nhân với hàm Waveletrồi thực hiện biến đổi riêng rẽ cho các khoảng tín hiệu khác nhau trong miền thời giantại các tần số khác nhau Cách tiếp cận như vậy còn được gọi là: phân tích đa phân giải– MRA (Multi Resolution Analysis): phân tích tín hiệu ở các tần số khác nhau và chocác độ phân giải khác nhau MRA khi phân tích tín hiệu cho phép: phân giải thời giantốt và phân giải tần số kém ở các tần số cao; phân giải tần số tốt và phân giải thời giankém ở các tần số thấp Như vậy kỹ thuật này rất thích hợp với những tín hiệu: có cácthành phần tần số cao xuất hiện trong khoảng thời gian ngắn, các thành phần tần sốthấp xuất hiện trong khoảng thời gian dài chẳng hạn như ảnh và khung ảnh video

Biến đổi Wavelet rời rạc (DWT)

Có thể hiểu phép biến đổi DWT như là áp dụng một tập các bộ lọc: thông cao vàthông thấp Thiết kế các bộ lọc này tương đương như kỹ thuật mã hoá băng con(subband coding) nghĩa là: chỉ cần thiết kế các bộ lọc thông thấp, còn các bộ lọc thôngcao chính là các bộ lọc thông thấp dịch pha đi một góc 1800 Tuy nhiên khác với mãhoá băng con, các bộ lọc trong DWT được thiết kế phải có đáp ứng phổ phẳng, trơn vàtrực giao

Trang 35

Các thủ tục nén gồm ba bước:

 Các hệ số chi tiết theo ngưỡng: Đối với mỗi mức phân tích từ 1 đến N đều

sử dụng một ngưỡng cho các hệ số chi tiết

Nén ảnh có hai phương pháp thực hiện Thứ nhất là giãn rộng Wavelet theo tínhiệu và lưu giữ chúng bởi một số lượng rất lớn các hệ số nguyên bản Trường hợpnày ta có thể thiết lập ngưỡng toàn cục và tất cả các mức phân tích đều sử dụngngưỡng này để thiết lập cho việc phân tích Phương pháp thứ hai là cho phép thiếtlập ngưỡng tự động có thể thay đổi giá trị tùy thuộc vào các mức

a Biến đổi Wavelet 1-D

Phân tích Wavelet 1-D

Bước phân tích: Tín hiệu được cho đi qua các bộ lọc thông cao và thông thấp rồiđược lấy mẫu xuống (down sampling) hệ số 2 tạo thành biến đổi DWT mức 1

Hình 2.6 minh họa quá trình phân tích Wavelet 1 chiều

Hình 2.6 Sơ đồ khối phân tích tín hiệu mức j

Biến đổi ngược Wavelet 1-D

Thực hiện biến đổi ngược, bắt đầu từ cAj và cDj, IDWT khôi phục cAj-1, đảongược các bước phân chia bằng việc chèn vào các giá trị 0 và kết hợp các kết quảvới các bộ lọc khôi phục

Định dạng
Số trang	70
Dung lượng	3,71 MB