1. Trang chủ
  2. » Luận Văn - Báo Cáo

đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH

70 1,2K 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 70
Dung lượng 3,71 MB

Nội dung

đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNHMỤC LỤCMỤC LỤCIDANH MỤC HÌNH VẼIVDANH MỤC BẢNG BIỂUVITHUẬT NGỮ VIẾT TẮTVIILỜI NÓI ĐẦUACHƯƠNG 1 TỔNG QUAN ẢNH SỐ VÀ CÁC KĨ THUẬT NÂNG CAO CHẤT LƯỢNG ẢNH11.1 TỔNG QUAN VỀ ẢNH SỐ11.2 CÁC KĨ THUẬT NÂNG CAO CHẤT LƯỢNG ẢNH11.2.1 Biến đổi mức xám11.2.1.1 Biến đổi âm bản21.2.1.2 Biến đổi log21.2.1.3 Biến đổi hàm mũ31.2.1.4 Giãn độ tương phản31.2.1.5 Kĩ thuật cắt theo mức41.2.2 Cân bằng mức xám51.2.3 So sánh mức xám61.2.4 Chèn nhiễu61.2.5 Lọc ảnh71.2.5.1 Lọc làm mịn ảnh8a. Lọc không gian tuyến tính8b. Lọc không gian phi tuyến8c. Lọc trung bình8d. Lọc thông thấp miền tần số91.2.5.2 Lọc sắc nét ảnh9a. Lọc thông cao9b. Lọc tần số từ không gian101.2.5 Các kĩ thuật làm nổi đường biên ảnh101.3 KẾT LUẬN CHƯƠNG 111CHƯƠNG 2 CÁC KĨ THUẬT NÉN ẢNH122.1 TỔNG QUAN VỀ NÉN ẢNH122.1.1 Giới thiệu chung về nén ảnh số122.1.2 Sơ đồ khối hệ thống nén ảnh điển hình132.1.3 Phân loại các kỹ thuật nén132.1.4 Các nguyên tắc khi nén ảnh142.1.5 Dư thừa số liệu142.1.5.1 Dư thừa mã (Coding Redundancy)152.1.5.2 Dư thừa trong pixel ( Interpixel Redudancy)162.1.5.3 Dư thừa tâm sinh lý (Psychovisual Redudancy)162.1.6 Giới thiệu một số kỹ thuật sử dụng trong nén ảnh172.1.6.1 Mã hoá dựa trên phép biến đổi DCT17a. Biến đổi DCT thuận và nghịch17b. Lượng tử và giải lượng tử19c. Mã hóa và giải mã192.1.6.2 Kỹ thuật mã hoá băng con20a. Ý tưởng mã hoá băng con20b. Mã hoá băng con202.1.6.3 Biến đổi Wavelet trong nén ảnh22a. Biến đổi Wavelet 1-D23b. Biến đổi Wavelet rời rạc 2-D242.1.7 Các tiêu chuẩn nén ảnh262.2. GIỚI THIỆU JPEG VÀ JPEG2000262.2.1 JPEG262.2.1.1 Giới thiệu sơ lược262.2.1.2 Sơ đồ khối272.2.2 JPEG2000282.2.2.1 Giới thiệu sơ lược282.2.2.2 Sơ đồ khối bộ mã hóa và bộ giải mã JPEG 2000282.2.3 So sánh JPEG và JPEG2000292.3 KẾT LUẬN CHƯƠNG 231CHƯƠNG 3 CHƯƠNG TRÌNH MÔ PHỎNG323.1 NGÔN NGỮ MATLAB323.1.1 Sơ lược lịch sử Matlab323.1.2 Đặc điểm của Matlab và các ứng dụng343.2 CHƯƠNG TRÌNH MÔ PHỎNG SỬ DỤNG MATLAB353.2.1 Giao diện chương trình mô phỏng353.2.2 Nâng cao chất lượng ảnh363.2.2.1 Biến đổi mức xám36a. Biến đổi mức xám sử dụng hàm imadjust37b. Biến đổi âm bản38c. Biến đổi log39d. Biến đổi hàm mũ39e. Biến đổi giãn độ tương phản40f. Kĩ thuật cắt theo mức413.2.2.2 Cân bằng mức xám413.2.2.3 So sánh mức xám423.2.2.4 Chèn nhiễu433.2.2.5 Lọc ảnh44a. Lọc làm mịn ảnh45b. Lọc sắc nét ảnh513.2.2.6 Các kĩ thuật làm nổi đường biên ảnh533.2.3 Nén ảnh543.2.3.1 Nén ảnh dùng mã hóa Huffman543.2.3.2 Nén ảnh dùng mã dự đoán không tổn thất543.2.3.3 Nén ảnh JPEG dùng biến đổi DCT543.2.3.4 Nén ảnh JPEG2000553.3 KẾT LUẬN CHƯƠNG 356KẾT LUẬN57TÀI LIỆU THAM KHẢO58

Trang 1

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Trang 2

Hà Nội 2008

Trang 3

MỤC LỤC

MỤC LỤC I DANH MỤC HÌNH VẼ IV DANH MỤC BẢNG BIỂU VI THUẬT NGỮ VIẾT TẮT VII LỜI NÓI ĐẦU A CHƯƠNG 1 TỔNG QUAN ẢNH SỐ VÀ CÁC KĨ THUẬT NÂNG CAO CHẤT

LƯỢNG ẢNH 1

1.1 TỔNG QUAN VỀ ẢNH SỐ 1

1.2 CÁC KĨ THUẬT NÂNG CAO CHẤT LƯỢNG ẢNH 1

1.2.1 Biến đổi mức xám 1

1.2.1.1 Biến đổi âm bản 2

1.2.1.2 Biến đổi log 2

1.2.1.3 Biến đổi hàm mũ 3

1.2.1.4 Giãn độ tương phản 3

1.2.1.5 Kĩ thuật cắt theo mức 4

1.2.2 Cân bằng mức xám 5

1.2.3 So sánh mức xám 6

1.2.4 Chèn nhiễu 6

1.2.5 Lọc ảnh 7

1.2.5.1 Lọc làm mịn ảnh 8

a Lọc không gian tuyến tính 8

b Lọc không gian phi tuyến 8

c Lọc trung bình 8

d Lọc thông thấp miền tần số 9

1.2.5.2 Lọc sắc nét ảnh 9

a Lọc thông cao 9

b Lọc tần số từ không gian 10

1.2.5 Các kĩ thuật làm nổi đường biên ảnh 10

1.3 KẾT LUẬN CHƯƠNG 1 11

CHƯƠNG 2 CÁC KĨ THUẬT NÉN ẢNH 12

Trang 4

2.1 TỔNG QUAN VỀ NÉN ẢNH 12

2.1.1 Giới thiệu chung về nén ảnh số 12

2.1.2 Sơ đồ khối hệ thống nén ảnh điển hình 13

2.1.3 Phân loại các kỹ thuật nén 13

2.1.4 Các nguyên tắc khi nén ảnh 14

2.1.5 Dư thừa số liệu 14

2.1.5.1 Dư thừa mã (Coding Redundancy) 15

2.1.5.2 Dư thừa trong pixel ( Interpixel Redudancy) 16

2.1.5.3 Dư thừa tâm sinh lý (Psychovisual Redudancy) 16

2.1.6 Giới thiệu một số kỹ thuật sử dụng trong nén ảnh 17

2.1.6.1 Mã hoá dựa trên phép biến đổi DCT 17

a Biến đổi DCT thuận và nghịch 17

b Lượng tử và giải lượng tử 19

c Mã hóa và giải mã 19

2.1.6.2 Kỹ thuật mã hoá băng con 20

a Ý tưởng mã hoá băng con 20

b Mã hoá băng con 20

2.1.6.3 Biến đổi Wavelet trong nén ảnh 22

a Biến đổi Wavelet 1-D 23

b Biến đổi Wavelet rời rạc 2-D 24

2.1.7 Các tiêu chuẩn nén ảnh 26

2.2 GIỚI THIỆU JPEG VÀ JPEG2000 26

2.2.1 JPEG 26

2.2.1.1 Giới thiệu sơ lược 26

2.2.1.2 Sơ đồ khối 27

2.2.2 JPEG2000 28

2.2.2.1 Giới thiệu sơ lược 28

2.2.2.2 Sơ đồ khối bộ mã hóa và bộ giải mã JPEG 2000 28

2.2.3 So sánh JPEG và JPEG2000 29

2.3 KẾT LUẬN CHƯƠNG 2 31

CHƯƠNG 3 CHƯƠNG TRÌNH MÔ PHỎNG 32

3.1 NGÔN NGỮ MATLAB 32

Trang 5

3.1.1 Sơ lược lịch sử Matlab 32

3.1.2 Đặc điểm của Matlab và các ứng dụng 34

3.2 CHƯƠNG TRÌNH MÔ PHỎNG SỬ DỤNG MATLAB 35

3.2.1 Giao diện chương trình mô phỏng 35

3.2.2 Nâng cao chất lượng ảnh 36

3.2.2.1 Biến đổi mức xám 36

a Biến đổi mức xám sử dụng hàm imadjust 37

b Biến đổi âm bản 38

c Biến đổi log 39

d Biến đổi hàm mũ 39

e Biến đổi giãn độ tương phản 40

f Kĩ thuật cắt theo mức 41

3.2.2.2 Cân bằng mức xám 41

3.2.2.3 So sánh mức xám 42

3.2.2.4 Chèn nhiễu 43

3.2.2.5 Lọc ảnh 44

a Lọc làm mịn ảnh 45

b Lọc sắc nét ảnh 51

3.2.2.6 Các kĩ thuật làm nổi đường biên ảnh 53

3.2.3 Nén ảnh 54

3.2.3.1 Nén ảnh dùng mã hóa Huffman 54

3.2.3.2 Nén ảnh dùng mã dự đoán không tổn thất 54

3.2.3.3 Nén ảnh JPEG dùng biến đổi DCT 54

3.2.3.4 Nén ảnh JPEG2000 55

3.3 KẾT LUẬN CHƯƠNG 3 56

KẾT LUẬN 57

TÀI LIỆU THAM KHẢO 58

Trang 6

DANH MỤC HÌNH VẼ

Hình 1.1 Biến đổi âm bản 2

Hình 1.2 Đồ thị hàm log 3

Hình 1.3 Đồ thị hàm mũ 3

Hình 1.4 Biến đổi giãn độ tương phản 4

Hình 1.5 Đồ thị kĩ thuật cắt theo mức 4

Hình 1.6 Biểu đồ hàm s = T(r) 5

Hình 1.7 Cơ chế lọc không gian 7

Hình 1.8 Đường biên của ảnh 10

Hình 2.1 Sơ đồ khối một hệ thống nén ảnh điển hình 13

Hình 2.2 Mô hình mã hóa dự đoán không tổn thất bao gồm bộ mã hóa và bộ giải mã 16 Hình 2.3 Sơ đồ mã hóa và giải mã dùng biến đổi DCT 17

Hình 2.4 Các bước của quá trình mã hóa biến đổi DCT đối với 1 khối 18

Hình 2.5 a) Băng lọc phân tích; b) Hai bộ lọc thông thấp và thông cao c) Phần vùng trong miền tần số; d) Băng lọc tổng hợp 21

Hình 2.6 Sơ đồ khối phân tích tín hiệu mức j 23

Hình 2.7 Sơ đồ biến đổi ngược Wavelet mức j 24

Hình 2.8 Sơ đồ phân tích Wavelet rời rạc 2-D 25

Hình 2.9 Sơ đồ biến đổi ngược Wavelet rời rạc 2-D 25

Hình 2.10 Sơ đồ khối bộ mã hóa và giải mã JPEG dựa trên biến đổi DCT 27

Hình 2.11 Sơ đồ khối bộ mã hóa và bộ giải mã JPEG 2000 28

Hình 2.12 So sánh JPEG, JPEG2000 29

Hình 2.13 Tỉ lệ nén của JPEG2000 và JPEG 30

Hình 2.14 Minh hoạ tính năng ROI 31

Hình 3.1 Giao diện chương trình nâng cao chất lượng và nén ảnh 36

Hình 3.2 Giao diện chương trình biến đổi ảnh xám 37

Hình 3.3 Đồ thị của các giá trị trong hàm imadjust 38

Hình 3.4 Ảnh âm bản 39

Hình 3.5 Ảnh biến đổi hàm log 39

Hình 3.6 Ảnh biến đổi hàm mũ 40

Trang 7

Hình 3.7 Ảnh giãn độ tương phản 40

Hình 3.8 Ảnh cắt theo mức không nền và có nền 41

Hình 3.9 Ảnh cân bằng và biểu đồ 42

Hình 3.10 Hai ảnh xám gần giống nhau 42

Hình 3.11 Ảnh xám thu được trước và sau khi cân bằng 43

Hình 3.12 Ảnh chèn nhiễu salf & pepper 43

Hình 3.13 Giao diện chương trình mô phỏng các phương pháp chèn và lọc nhiễu 44

Hình 3.14 Ảnh lọc sử dụng bộ lọc trung bình 47

Hình 3.15 Ảnh thu được nhờ bộ lọc Laplace có giá trị -4 và -8 ở chính giữa 48

Hình 3.16 Ảnh lọc không gian phi tuyến 49

Hình 3.17 Ảnh lọc trung vị 3x3 50

Hình 3.18 Ảnh lọc trung bình 50

Hình 3.19 Ảnh lọc thông thấp 51

Hình 3.20 Ảnh lọc thông cao cơ bản 51

Hình 3.21 Ảnh lọc emphasis cao tần 52

Hình 3.22 Ảnh lọc tần số từ không gian 53

Hình 3.23 Giao diện nén ảnh JPEG và JPEG2000 55

Trang 8

DANH MỤC BẢNG BIỂU

Bảng 2.1 Số bit mỗi pixel 30Bảng 3.1 Các bộ lọc đặc biệt 45

Trang 9

THUẬT NGỮ VIẾT TẮT

D

DCT Discrete Cosin Transform Biến đổi cosin rời rạc

DFT Discrete Fourier Transform Biến đổi Fourier rời rạc

DWT Discrete Wavelet Transform Biến đổi Wavelet rời rạc

IPT Image Processing Toolbox Hộp công cụ xử lí ảnh

ISO International Organization for

Trang 10

SNR Signal-to-Noise Ratio Tỷ số tín hiệu trên nhiễu

R

RMSE Root Mean Square Error Lỗi trung bình quân phương

Trang 11

LỜI NÓI ĐẦU

Trong nhiều thập kỷ gần đây, cùng với sự tiến bộ của khoa học kỹ thuật, sự pháttriển mạnh mẽ của máy tính và sự ra đời của Internet thì nhu cầu các dịch vụ

dữ liệu truyền trên mạng là rất lớn, nhất là dữ liệu đa phương tiện Ảnh số ra đờikhiến cho nhu cầu của con người về chất lượng ảnh cũng ngày càng tăng cao Conngười sử dụng ảnh số cho nhiều mục đích, nhiều lĩnh vực khác nhau, từ nghệ thuật, yhọc cho tới thiên văn học, địa lý,…Vì vậy ảnh số phải được xử lí sao cho phù hợp vớitừng mục đích cụ thể Xuất phát từ nhu cầu đó của con người, nhiều kỹ thuật xử lí ảnhsố ra đời Xử lí ảnh số mặc dù là một khoa học còn tương đối mới mẻ so với nhiềungành khoa học khác nhất là trên quy mô công nghiệp, song nó đã đem lại nhiều lợiích Xử lí ảnh số bao gồm việc tìm tòi nghiên cứu về các kĩ thuật nén ảnh để đảm bảotiết kiệm băng thông truyền dẫn, giảm bớt không gian lưu trữ để truyền thông tin trênmạng một cách dễ dàng và nhanh chóng Ngoài ra, các thuật toán nhằm nâng cao chấtlượng ảnh cũng là một vấn đề đòi hỏi sự đầu tư nghiên cứu Các thuật toán, các phépbiến đổi nâng cao chất lượng ảnh mà chúng ta đã biết như tạo ảnh âm bản, chèn nhiễu,tăng, giãn độ tương phản, biến đổi logic số học, phép lọc…

Các kỹ thuật nén sử dụng phép biến đổi Fourier (FT), biến đổi cosine rời rạc(DCT), biến đổi Wavelet (DWT) có nhiều ưu điểm không chỉ trong xử lí ảnh màcòn nhiều ứng dụng khác Bằng chứng là sự ra đời của chuẩn nén JPEG (DCT) vàJPEG2000 (dựa trên DWT) đang được sử dụng rất rộng rãi

Với mục tiêu xây dựng chương trình mô phỏng, minh họa cho các kĩ thuật nângcao chất lượng và nén ảnh, em quyết định chọn đề tài này để làm đồ án tốt nghiệp

Đồ án của em chia làm 3 chương:

- Chương 1 giới thiệu tổng quan về ảnh số và các kĩ thuật nâng cao chất lượngảnh như biến đổi ảnh xám, biến đổi âm bản, các phương pháp lọc ảnh nhiễu

- Chương 2 giới thiệu về kĩ thuật nén ảnh và đi sâu vào 2 chuẩn nén ảnh JPEG

và JPEG2000

- Chương 3 giới thiệu tổng quan về ngôn ngữ lập trình Matlab và chương trình

mô phỏng kĩ thuật nâng cao chất lượng và nén ảnh bằng Matlab

Trang 13

CHƯƠNG 1 TỔNG QUAN ẢNH SỐ VÀ CÁC KĨ THUẬT NÂNG CAO CHẤT

Trong chương này, ta tìm hiểu về một số kĩ thuật nâng cao chất lượng ảnh nhưbiến đổi ảnh xám, các phương pháp lọc nhiễu, làm nổi đường biên ảnh Các kĩ thuậtnày hiện nay đang được ứng dụng rộng rãi trong nhiều lĩnh vực

1.1 Tổng quan về ảnh số

Hình ảnh tĩnh có thể được biểu diễn bởi hàm 2 chiều f(x,y), trong đó x và y là tọa

độ không gian phẳng (2 chiều) Khi xét ảnh “đen-trắng”, giá trị hàm f tại một điểmđược xác định bởi tọa độ (x, y) được gọi là độ chói (mức xám) của ảnh tại điểm này.Nếu x, y và f là các giá trị rời rạc, ta gọi ảnh đó là ảnh số Xử lí ảnh số là quá trình biếnđổi ảnh số trên máy tính Như vậy, ảnh số được tạo ra bởi một số hữu hạn các điểmảnh, mỗi điểm ảnh nằm tại một vị trí nhất định và có một giá trị nhất định Một điểmảnh trong một ảnh còn được gọi là một pixel

1.2 Các kĩ thuật nâng cao chất lượng ảnh

Hệ thống thị giác là cơ quan cảm nhận hình ảnh quang học tương đối hoàn hảo,cho phép con người cảm nhận được hình ảnh quang học trong thiên nhiên Ứng dụngquan trọng nhất của nâng cao chất lượng ảnh là biến đổi tính chất của ảnh số nhằm tạocảm nhận về sự gia tăng chất lượng hình ảnh quang học

1.2.1 Biến đổi mức xám

Hàm biến đổi mức xám có công thức như sau:

Trang 14

trong đó r: mức xám ảnh vào f(x, y)

s: mức xám ảnh ra g(x, y)

T: hàm biến đổi mức xám

1.2.1.1 Biến đổi âm bản

Âm bản của một ảnh có các mức xám trong khoảng [0, L-1] được tạo ra nhờ phépbiến đổi âm Phép biến đổi này ứng dụng rất nhiều trong các phim ảnh trong y học.Hàm sử dụng trong ảnh âm bản như sau:

trong đó L: mức xám cao nhất

u: mức xám của ảnh vào

f(u): hàm biến đổi mức xám của ảnh vào

Hình 1.1 Biến đổi âm bản [7]

Phép biến đổi này phù hợp cho việc nâng cao các chi tiết trắng hoặc xám nằmtrong vùng tối của ảnh, đặc biệt là khi vùng tối chiếm phần lớn kích thước ảnh

1.2.1.2 Biến đổi log

Các biến đổi log được thực hiện bằng cách sử dụng công thức:

trong đó r: mức xám ảnh vào

c: hằng số

s: mức xám ảnh ra

Trang 15

Hình 1.2 Đồ thị hàm log 1.2.1.3 Biến đổi hàm mũ

Phép biến đổi theo hàm mũ có công thức cơ bản như sau:

trong đó r: mức xám ảnh vào

s: mức xám ảnh ra

c và : các hằng số dương

Hình 1.3 Đồ thị hàm mũ

1.2.1.4 Giãn độ tương phản

Hàm biểu diễn trong hình 1.4 được gọi là một hàm biến đổi giãn độ tương phản bởi vì nó nén các mức đầu vào thấp hơn m thành một khoảng hẹp các mức tối trên ảnh ra; tương tự, nó nén các giá trị phía trên m thành một băng hẹp các mức sáng trên đầu

ra Kết quả ra là một ảnh có độ tương phản cao hơn

Trang 16

Hình 1.4 Biến đổi giãn độ tương phản 1.2.1.5 Kĩ thuật cắt theo mức

Kỹ thuật này dùng 2 phép ánh xạ khác nhau cho trường hợp có nền và không nền

b u a khi L u

0 )

Đồ thị tương ứng của các hàm này như sau:

Hình 1.5 Đồ thị kĩ thuật cắt theo mức

Biến đổi này cho phép phân đoạn một số mức xám từ phần còn lại của ảnh Nó cótác dụng khi nhiều đặc tính khác nhau của ảnh nằm trên nhiều miền mức xám khácnhau

1.2.2 Cân bằng mức xám

Ảnh có mức xám từ [0, L-1] sẽ có biểu đồ mức xám là:

Trang 17

h(rk) = nk (1.7) [2]

với rk là mức xám thứ k và nk là số pixel trong ảnh có cùng mức xám là rk

Có thể chuẩn hóa bằng cách chia nk cho tổng số pixel của cả ảnh Biểu đồ chuẩnhóa sẽ là: p(rk)= nk/n, n là tổng số pixel của cả ảnh p(rk) phản ánh xác suất xuất hiệncủa mức xám rk Chú ý là tổng các thành phần biểu đồ chuẩn hóa phải bằng 1

Biểu đồ có thể coi là phản ánh xấp xỉ xác suất xuất hiện của các giá trị mức xámtrong ảnh Biểu đồ chính là nền tảng của đa số kỹ thuật xử lí miền không gian, còn cóthể sử dụng cho các kỹ thuật nén ảnh, phân rã ảnh… Vận dụng biểu đồ có hiệu quả rấttốt đối với nâng cao chất lượng ảnh

Đối với các ảnh có mức xám quá tập trung ở vùng tối hoặc vùng trắng, chúng tacó thể sử dụng phương pháp cân bằng mức xám của ảnh để phân tán biểu đồ xám

Ta định nghĩa hàm s như sau bằng T(r), r thuộc [0, 1] thỏa mãn các điều kiện sau:

- T(r) đơn trị và đơn điệu tăng trên [0, 1] (a)

với s và T(r) là mức xám ảnh ra và biến đổi T của mức xám ảnh vào

Điều kiện (a) để đảm bảo tồn tại quá trình biến đổi ngược và điều kiện đơn điệutăng để đảm bảo ảnh sau khi biến đổi không bị thay đổi thứ tự mức xám (trắng thànhđen và ngược lại)

Hình 1.6 Biểu đồ hàm s = T(r)

Với pr(w) là xác suất của mức xám w:

s = T(r) = r p r w dw

Trang 18

Với trường hợp r là rời rạc (tín hiệu số), ta có:

j

r r p

0

) (

k j

k n

n

0 k = 0, 1, 2, , L – 1 (1.10) [2]

Kết quả của quá trình biến đổi này là ảnh ra có phân bố biểu đồ đồng đều.Phương pháp này gọi là cân bằng biểu đồ

1.2.3 So sánh mức xám

Có những ảnh khi quan sát ta khó có thể phân biệt được sư khác nhau giữa haiảnh xám Để có thể so sánh hai ảnh một cách rõ ràng chúng ta có thể sử dụng phép trừhai ảnh này cho nhau: mức xám của điểm ảnh thu được sẽ bằng mức xám của điểmảnh trên ảnh thứ nhất trừ cho mức xám trên điểm ảnh thứ hai Kĩ thuật này thườngđược dùng trong dự báo thời tiết và trong y học

1.2.4 Chèn nhiễu

Khi truyền ảnh đi trên một kênh truyền nào đó thì sẽ có ảnh hưởng của nhiễu,việc loại bỏ nhiễu sẽ đưa ra ảnh có chất lượng cao hơn Thông thường, người ta xétđến 3 loại nhiễu chính:

• Nhiễu cộng: Nhiễu cộng thường phân bố khắp ảnh Nếu gọi ảnh quan sát (ảnh

thu được) là Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu được có thể biểu diễn bởi:

Trang 19

gian và lọc tần số Lọc trong miền không gian là nhân chập một ảnh xám f(x, y) với 1mặt nạ lọc h(x, y) (là một ma trận H kích thước nhỏ) để tạo ra ảnh mới Trên thực tế,tích chập không gian thường được đơn giản hóa bằng cách sử dụng các mặt nạ nhỏ,giữ lại các đặc điểm nổi bật của các ảnh Với f(x, y) là ảnh vào, g(x, y) là ảnh ra, h(x,y) là mặt nạ lọc, ta có:

Ta cũng có thể làm tương tự trong miền tần số bằng cách nhân F(u, v) với H(u,v), đây chính là biến đổi Fourier của lọc không gian Người ta thường gọi H(u, v) làhàm truyền đạt Tùy thuộc ma trận sử dụng mà ta nhận được các kết quả khác nhau

với F(u, v), G(u, v) là biến đổi Fourier của ảnh vào và ảnh ra, H(u, v) là hàm truyền đạtcủa bộ lọc

Hình 1.7 Cơ chế lọc không gian 1.2.5.1 Lọc làm mịn ảnh

Ý tưởng của phương pháp lọc làm mịn là thay giá trị của một pixel bằng giá trịmức xám trung bình của các pixel trong mặt nạ Phương pháp này sẽ giúp loại bỏ các

Trang 20

chi tiết không liên quan trước khi thực hiện tách các đối tượng trong ảnh Chi tiết ởđây là nhóm các pixel có kích thước rất nhỏ so với mặt nạ Tuy nhiên phương phápnày tạo ra tác dụng không mong muốn là làm giảm độ nét của ảnh.

a Lọc không gian tuyến tính

Lọc không gian tuyến tính là quá trình lọc mà c ác phép toán thực hiện trên cácpixel của các vùng lân cận là tuyến tính

Với lọc tuyến tính, đáp ứng được đưa ra bởi phép cộng các hệ số của bộ lọc nhânvới pixel ảnh tương ứng trong vùng được quét bởi mặt nạ

Ví dụ cho lọc tuyến tính với mặt nạ 3x3, đáp ứng R tại điểm (x,y):

R = w(- 1, - 1) f(x - 1, y - 1) + w(- 1, 0) f(x - 1, y) +…+ w(0, 0) f(x, y) + +

b Lọc không gian phi tuyến

Đối với lọc phi tuyến thì giá trị của đáp ứng R không đơn thuần là tổng của cáctích của hệ số bộ lọc với các giá trị pixel tương ứng, mà nó còn phụ thuộc vào bản thângiá trị của các pixel

Lọc thống kê thứ tự là lọc phi tuyến trong đó đáp ứng R của bộ lọc được tạo radựa trên thứ tự của các pixel trong vùng được quét bởi mặt nạ

Điển hình cho loại này là lọc trung vị Giống như tên gọi của nó, trong phép lọctrung vị, giá trị mức xám của pixel sẽ được thay thế bởi mức xám trung bình của cácpixel lân cận nó Phương pháp này được sử dụng khá phổ biến để giảm nhiễu, đặc biệt

là loại nhiễu xung (impulse noise hay còn gọi là saft-and-pepper noise)

c Lọc trung bình

Do có nhiều loại nhiễu can thiệp vào quá trình xử lí ảnh nên cần có nhiều bộ lọcthích hợp Trường hợp tổng quát có thể dùng phương pháp lọc trung bình với các bộlọc có kích thước khác nhau, mỗi điểm ảnh được thay thế bằng trung bình trọng số củacác điểm lân cận và được định nghĩa như sau:

v(m, n) = (k,l)eW a(k,l)y(mk,nl) (1.16) [7]

Nếu trong kỹ thuật lọc trên, ta dùng các trọng số như nhau, phương trình trên sẽtrở thành:

Trang 21

v(m, n) = N1 (k,l)eW y(mk,nl) (1.17) [7]

với y(m, n) là ảnh đầu vào, v(m, n) là ảnh đầu ra và a(k, l) là cửa sổ lọc, ak,l = 1/Nw và

Nw là số điểm ảnh trong cửa sổ lọc W

d Lọc thông thấp miền tần số

Về cơ bản, ý tưởng lọc trong miền tần số là lựa chọn một hàm truyền đạt để nhânvới F(u, v), tạo ra một ảnh mới Ví dụ, ta có một hàm truyền đạt mà khi nhân hàm nàyvới một F(u, v) trung tâm sẽ làm suy giảm các thành phần cao tần của F(u, v), trongkhi đó việc loại bỏ các tần số thấp gần như không thay đổi

1.2.5.2 Lọc sắc nét ảnh

Mục đích của lọc làm sắc nét ảnh là làm nổi bật các chi tiết nhỏ hoặc chi tiết bị

mờ, có thể do nhiễu hoặc do quá trình thu nhận ảnh Các kĩ thuật lọc làm sắc nét đều làlọc miền tần số

a Lọc thông cao

Lọc thông thấp làm mờ một ảnh, ngược lại, lọc thông cao lọc sắc nét ảnh nhờ làmsuy giảm các thành phần tần thấp và loại bỏ gần hết các thành phần cao tần của biếnđổi Fourier

Lọc thông cao cơ bản

Cho hàm truyền đạt Hlp(u, v) của 1 bộ lọc thông thấp, ta thu được hàm truyền đạtcủa bộ lọc thông cao tương ứng nhờ sử dụng:

Lọc emphasis cao tần

Các bộ lọc thông cao như trên sẽ làm giảm giá trị trung bình của ảnh tới 0 Như tađã thấy ở trên, ảnh lọc nét hơn nhưng lại tối hơn nhiều so với ảnh gốc Một phươngpháp giải quyết vấn đề này là chèn thêm vào một offset để lọc thông cao Khi offset

kết hợp với việc nhân bộ lọc với một số lớn hơn 1 thì phương pháp này được gọi là lọc

emphasis cao tần bởi vì phép nhân làm nổi rõ các tần số cao

Emphasis cao tần có hàm truyền đạt:

Trang 22

trong đó a là offset, b là số nhân và Hhp(u, v) là hàm truyền đạt của bộ lọc thông cao.

Để có kết quả lọc cao hơn, sau khi lọc emphasis cao tần ta nên sử dụng phương pháp

cân bằng biểu đồ

b Lọc tần số từ không gian

Thông thường, lọc trong miền không gian có hiệu suất tính toán cao hơn lọc miền

tần số khi các bộ lọc nhỏ Định nghĩa nhỏ khá phức tạp, nó phụ thuộc vào các hệ số

lọc, kích thước của bộ đệm, các dữ liệu phức hợp được xử lí như thế nào Tuy nhiên,khi đem ra so sánh, ta thấy bộ lọc sử dụng thuật toán FFT có thể nhanh hơn là một bộlọc trong miền không gian Do đó, người ta nhận thấy nên chuyển lọc không gianthành kĩ thuật lọc miền tần số tương đương chứa ưu điểm của cả hai phương pháp này

1.2.5 Các kĩ thuật làm nổi đường biên ảnh

Làm nổi biên ảnh là vấn đề quan trọng trong phân tích ảnh Trước hết, ta cần tìmhiểu về khái niệm biên ảnh Một điểm ảnh được coi là nằm trên đường biên nếu tại vịtrí điểm ảnh đó có sự thay đổi đột ngột của mức xám Như vậy, đường biên là đườngnối các điểm ảnh nằm trong khu vực ảnh có thay đổi đột ngột về độ chói, đường biênthường ngăn cách hai vùng ảnh có các mức xám gần như không đổi

Hình 1.8 Đường biên của ảnh

Trong trường hợp lí tưởng, độ chói giữa hai vùng ảnh thay đổi đột ngột hoặc tăngdần đều Tuy nhiên trên thực tế, mức xám giữa các vùng ảnh thay đổi tương đối ngẫunhiên Chính vì vậy quá trình phát hiện đường biên thường không đơn giản và kết quảthường không hoàn toàn chính xác

1.3 Kết luận chương 1

Kết thúc chương 1, một số kĩ thuật nâng cao chất lượng ảnh như biến đổi ảnhxám (biến đổi âm bản, biến đổi hàm log, hàm mũ), lọc nhiễu (lọc thông thấp, thôngcao, lọc phi tuyến, tuyến tính, lọc trung vị,…), làm nổi biên ảnh đã được đề cập đến

Trang 23

Trên thực tế, nâng cao chất lượng ảnh còn rất nhiều vấn đề đáng chú ý khác như các kĩthuật làm trơn ảnh, tách nhiễu, khử nhiễu, làm trơn biên, khuếch đại ảnh, lọc đồnghình, lọc ngoài, lọc giả trung vị

Trang 24

CHƯƠNG 2 CÁC KĨ THUẬT NÉN ẢNH

Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet thì việctìm một phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin và truyềnthông tin trên mạng nhanh chóng đang là một yêu cầu cấp thiết Trong những năm gầnđây, có rất nhiều các phương pháp đã và đang được nghiên cứu rộng rãi để thực hiệnnén ảnh Tất cả đều với một mục đích chung là làm thế nào để biểu diễn một ảnh với ítbit nhất để có thể tối thiểu hoá dung lượng kênh truyền và không gian lưu trữ trong khivẫn giữ được tính trung thực của ảnh Điều này tương đương với việc biểu diễn ảnh có

độ tin cậy cao nhất với tốc độ bit nhỏ nhất

2.1 Tổng quan về nén ảnh

2.1.1 Giới thiệu chung về nén ảnh số

Thông thường, ảnh đen trắng chưa nén được biểu diễn bằng 8 bit/pixel và ảnhmàu là 24 bit/pixel Các kỹ thuật nén hiện nay cho phép dung lượng ảnh được néngiảm 30 đến 50 lần so với ảnh gốc mà ảnh vẫn giữ được độ trung thực cao Độ trungthực của ảnh được đánh giá dựa trên tiêu chí như lỗi trung bình quân phương (MSE)hoặc tỷ số tín hiệu trên nhiễu (SNR) giữa ảnh gốc và ảnh nén

Những phương pháp thường (như Compress trong hệ UNIX) không đem lại hiệuquả: tỷ lệ nén dữ liệu cho hình ảnh không quá 2:1 Nhưng với những phương phápchuyên dụng có thể đạt tới 30:1 Hai phương pháp nén hình ảnh nổi tiếng nhất hiệnnay là của nhóm chuyên gia về hình ảnh động (Motion Picture Experts Group -MPEG) và liên hiệp các nhóm chuyên gia về hình ảnh (Joint Photo Graphic ExpertsGroup - JPEG) Những phương pháp này đã trở thành chuẩn công nghiệp Nhữngnhược điểm cơ bản của các phương pháp này là sự mất mát thông tin và hiệu quả nénkhông cao đối với những hình ảnh phức tạp

Tất cả các phương pháp nén ảnh đều dựa trên một nguyên lý đơn giản: trong dữliệu có nhiều phần tử thừa và nén ảnh dựa trên cơ sở tìm ra những phần tử đó và loạibỏ chúng

Trang 25

Các phương pháp thông dụng hiện nay như biến đổi cosin rời rạc, nén ảnhWavelet (WIC) phải dùng đến biến đổi toán học và xấp xỉ các mối tương quan giữacác pixel Với các phương pháp này ta có thể nén ảnh tới tỷ lệ 20:1 – 30:1 Nhưngnhững ảnh này (vì bị mất thông tin) chỉ là những ảnh gần đúng với ảnh ban đầu, ngoài

ra còn có thể xuất hiện biến dạng hình ảnh

2.1.2 Sơ đồ khối hệ thống nén ảnh điển hình

Hình 2.1 Sơ đồ khối một hệ thống nén ảnh điển hình

- Khối biến đổi: Thường dùng phép biến đổi cosin rời rạc để tập trung năng lượng tínhiệu vào một số lượng nhỏ các hệ số khai triển để thực hiện phép nén hiệu quả hơn làdùng tín hiệu nguyên thủy

- Khối lượng tử: Tạo ra một lượng kí hiệu giới hạn cho ảnh nén với hai kĩ thuật:lượng tử vô hướng (thực hiện lượng tử hóa cho từng phần dữ liệu) và lượng tử vector(thực hiện lượng tử hóa một lần một khối dữ liệu) Quá trình này không thuận nghịch

- Khối mã hóa: Gán một từ mã, một dòng bit nhị phân cho mỗi kí hiệu, số nguyêngần nhất

2.1.3 Phân loại các kỹ thuật nén

Có nhiều cách phân loại các phương pháp nén khác nhau Cách thứ nhất dựa vàonguyên lý nén Cách này phân các phương pháp nén thành hai họ lớn:

giải nén ta khôi phục được chính xác ảnh gốc Các phương pháp nén này bao gồm mãhoá Huffman, mã hoá thuật toán…

- Nén ảnh có mất thông tin (nén có tổn hao): Ảnh giải nén có một sự sai khác nhỏ sovới ảnh gốc Các phương pháp này bao gồm:

 Mã hoá biến đổi: biến đổi cosin rời rạc (DCT), biến đổi Fourier nhanh(FFT)

Trang 26

 Mã hoá băng con.

Ngoải ra, ta có thể phân loại dựa vào cách thức thực hiện nén Theo cách này,người ta cũng phân thành hai họ: Phương pháp nén dữ liệu không gian và phươngpháp sử dụng mã hóa biến đổi Hoặc cũng có thể phân loại dựa vào lý thuyết mã hóa.Cách này cũng phân các phương pháp nén thành hai họ: Các phương pháp nén thế hệthứ nhất (gồm các phương pháp mà mức độ tính toán là đơn giản, thí dụ việc lấy mẫu,gán từ mã, ) và các phương pháp nén thế hệ thứ hai (dựa vào độ bão hòa của tỷ lệnén)

2.1.4 Các nguyên tắc khi nén ảnh

Một tính chất chung nhất của tất cả các ảnh số đó là tương quan giữa các pixel ởcạnh nhau lớn, điều này dẫn đến dư thừa thông tin để biểu diễn ảnh Dư thừa thông tin

sẽ làm cho việc mã hoá không tối ưu Do đó công việc cần làm để nén ảnh là phải tìmđược các biểu diễn ảnh với tương quan nhỏ nhất để giảm thiểu độ dư thừa thông tincủa ảnh Thực tế, có hai kiểu dư thừa thông tin được phân loại như sau:

- Dư thừa trong miền không gian: tương quan giữa các giá trị pixel của ảnh, điều nàycó nghĩa rằng các pixel lân cận của ảnh có giá trị gần giống nhau (trừ những pixel ởgiáp đường biên ảnh)

- Dư thừa trong miền tần số: Tương quan giữa các mặt phẳng màu hoặc dải phổ khácnhau

Trọng tâm của các nghiên cứu về nén ảnh là tìm cách giảm số bit cần để biểudiễn ảnh bằng việc loại bỏ dư thừa trong miền không gian và miền tần số càng nhiềucàng tốt

2.1.5 Dư thừa số liệu

Nén số liệu là quá trình giảm lượng số liệu cần thiết để biểu diễn cùng một lượngthông tin cho trước Cần phải phân biệt giữa số liệu và thông tin Thực tế, số liệu vàthông tin không đồng nghĩa với nhau Số liệu (tín hiệu) chỉ là phương tiện dùng đểtruyền tải thông tin Cùng một lượng thông tin cho trước có thể biểu diễn bằng cáclượng số liệu khác nhau

Trong nén ảnh số, có ba loại dư thừa số liệu có thể được nhận dạng và phân biệt

Trang 27

2.1.5.1 Dư thừa mã (Coding Redundancy)

Nếu các mức của tín hiệu video được mã hóa bằng các symbol nhiều hơn cầnthiết (tuyệt đối) thì kết quả là có độ dư thừa mã Để giảm độ dư thừa mã, trong nén ảnhthường sử dụng các mã VLC như mã Huffman, mã RLC Lượng thông tin về hìnhảnh có xác suất thấp hơn

Nguyên lý cơ bản của việc nén ảnh này là các từ mã có độ dài biến đổi, cho phépgán các từ mã ngắn nhất cho các mức xám có tần suất xuất hiện nhiều nhất trong ảnh.Câu hỏi được đặt ra là: Cần bao nhiêu bit để thay thế cho các mức xám trong một ảnh.Đó là, liệu có tồn tại dữ liệu nhỏ đủ để mã hóa đầy đủ một ảnh mà không gây ra tổnthất?

Ý tưởng này là khởi đầu cho việc thông tin có thể được xử lí giống như cách xử líxác suất Với giả định này, một sự kiện ngẫu nhiên E với xác suất P(E) có chứa lượngthông tin:

I(E) = log P(1E) = – log P(E) (2.1) [2]

Nếu P(E) = 1 (sự kiện luôn luôn đúng) thì I(E) = 0 và không có thông tin nàotrong nó Vì không có sự không chắc chắn nào liên quan tới sự kiện nên sẽ không cóthông tin được truyền tải thông báo rằng sự kiện đó đã xảy ra Cho một tập hợp các sựkiện ngẫu nhiên gốc rời rạc {a1, a2, …, aj} có xác suất tương ứng là {P(a1), P(a2), …,P(aj)}, lượng thông tin trung bình trên mỗi đầu ra (hay còn gọi là entropy) là:

H = –

J j

j

a P

1

) ( log )

Nếu một ảnh nhận được là một mẫu “nguồn mức xám”, chúng ta có thể mô hìnhhóa các xác suất kí hiệu của nguồn bằng cách sử dụng một ma trận mức xám của ảnhnày và tính toán giá trị xấp xỉ (gọi là xấp xỉ thứ tự ưu tiên: first-order estimate) củaentropy gốc:

~

L k

k r k

P

1

)(log)

Giá trị xấp xỉ được tính toán bởi hàm entropy (với giả thiết mỗi mức xám đượcmã hóa độc lập) có biên thấp hơn nhờ việc loại bỏ dư thừa mã

Trang 28

2.1.5.2 Dư thừa trong pixel ( Interpixel Redudancy)

Vì giá trị của một pixel bất kì nào đó cũng có thể được dự báo từ giá trị của cáclân cận của nó, nên thông tin từ các pixel riêng là tương đối nhỏ Sự tham gia của mộtpixel riêng vào một ảnh là dư thừa Nhiều tên (bao gồm: dư thừa không gian, dư thừahình học, dư thừa trong ảnh) được đặt ra để phân biệt sự phụ thuộc này của các pixel

Ta dùng độ dư thừa trong pixel để chỉ tất cả các tên trên Để giảm độ dư thừa trongpixel của một ảnh, dãy pixel hai chiều dùng cho việc nhìn và nội suy, phải được biếnđổi thành một dạng có hiệu quả hơn

Người ta đưa ra một phương pháp gọi là mã hóa dự đoán không tổn thất để loại

bỏ các dư thừa trong pixel của các pixel kề nhau bằng cách chỉ đưa ra và mã hóa thôngtin mới trong mỗi pixel “Thông tin mới” của 1 pixel là sự khác biệt giữa giá trị thực tế

và giá trị dự đoán của pixel đó

Hình 2.2 Mô hình mã hóa dự đoán không tổn thất bao gồm bộ mã hóa và bộ giải mã 2.1.5.3 Dư thừa tâm sinh lý (Psychovisual Redudancy)

Bằng trực quan ta thấy, sự thu nhận cường độ ánh sáng thay đổi chỉ giới hạntrong một phạm vi nhất định Hiện tượng này xuất phát từ sự thật là mắt không đápứng với cùng độ nhạy của tất cả các thông tin nhìn thấy Thông tin đơn giản có tầmquan trọng ít hơn thông tin khác trong vùng nhìn thấy Thông tin này được gọi là độ dưthừa tâm sinh lý Nó có thể được loại bỏ mà không ảnh hưởng đáng kể đến chất lượng

Trang 29

thu nhận ảnh Khác với độ dư thừa mã và dư thừa trong pixel, độ dư thừa tâm sinh lýcó liên quan đến thông tin theo định lượng Quá trình loại bỏ nó là đáng kể bởi vìthông tin của nó không cần thiết cho quá trình xử lí thị giác chuẩn Dư thừa tâm sinh lícó quan hệ tới việc lượng tử hóa Điều đó có nghĩa là ánh xạ một khoảng rộng các giátrị đầu vào lên một số hữu hạn các giá trị đầu ra Khi nó là toán tử không đảo ngược(mất thông tin) cho kết quả nén số liệu có tổn hao.

2.1.6 Giới thiệu một số kỹ thuật sử dụng trong nén ảnh

2.1.6.1 Mã hoá dựa trên phép biến đổi DCT

Nguyên tắc chính của phương pháp mã hoá này là biến đổi tập các giá trị pixelcủa ảnh trong miền không gian sang một tập các giá trị khác trong miền tần số sao chocác hệ số trong tập giá trị mới này có tương quan giữa các điểm ảnh gần nhau nhỏ hơn

Hình 2.3 Sơ đồ mã hóa và giải mã dùng biến đổi DCT [4]

a Biến đổi DCT thuận và nghịch

Vì ảnh gốc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT, ảnhđược phân chia thành các khối vuông, mỗi khối này thường có kích thước 8 x 8 pixel

và biểu diễn các mức xám của 64 điểm ảnh, các mức xám này là các số nguyên dươngcó giá trị từ 0 đến 255 Việc phân khối này sẽ làm giảm được một phần thời gian tínhtoán các hệ số chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ làm tăng độchính xác khi tính toán với dấu phẩy tĩnh, giảm thiểu sai số do làm tròn sinh ra

Biến đổi DCT là một công đoạn chính trong các phương pháp nén sử dụng biếnđổi Hai công thức ở đây minh hoạ cho 2 phép biến đổi DCT thuận nghịch đối với mỗi

Trang 30

khối ảnh có kích thước 8 x 8 Giá trị x(n1, n2) biểu diễn các mức xám của ảnh trongmiền không gian, X(k1, k2) là các hệ số sau biến đổi DCT trong miền tần số.

Hình 2.4 Các bước của quá trình mã hóa biến đổi DCT đối với 1 khối [4]

Trang 31

Chú ý rằng bản thân biến đổi DCT không làm mất thông tin vì DCT là một biếnđổi tuyến tính chuyển các giá trị của điểm ảnh từ miền không gian thành các hệ sốtrong miền tần số Nếu biến đổi DCT thuận và nghịch được tính toán với độ chính xáctuyệt đối và nếu các hệ số DCT không phải qua bước lượng tử và mã hoá thì ảnh thuđược sau biến đổi DCT ngược sẽ giống hệt ảnh gốc.

b Lượng tử và giải lượng tử

Sau khi thực hiện biến đối DCT, 64 hệ số sẽ được lượng tử hoá dựa trên một

bảng lượng tử gồm 64 phần tử Q(u,v) với 0 ≤ u, v ≤ 7 Bảng này được định nghĩa bởi

từng ứng dụng cụ thể Các phần tử trong bảng lượng tử có giá trị từ 1 đến 255 đượcgọi là các bước nhảy cho các hệ số DCT Quá trình lượng tử được coi như là việc chiacác hệ số DCT cho bước nhảy lượng tử tương ứng, kết quả này sau đó sẽ được làm

tròn xuống số nguyên gần nhất Công thức (2.6) thể hiện việc lượng tử với F(u,v) là các hệ số DCT, F Q (u,v) là các hệ số sau lượng tử, các hệ số này sẽ được đưa vào bộ mã

) , (

v u Q

v u F

Mục đích của việc lượng tử hoá là giảm số lượng bit cần để lưu trữ các hệ số biếnđổi bằng việc giảm độ chính xác của các hệ số này cho nên lượng tử là quá trình xử lícó mất thông tin

Quá trình giải lượng tử ở phía bộ giải mã được thực hiên ngược lại Các hệ số sau

bộ giải mã entropy sẽ nhân với các bước nhảy trong bảng lượng tử (bảng lượng tửđược đặt trong phần mào đầu của ảnh JPEG) Kết quả này sau đó sẽ được đưa vào biếnđổi DCT ngược

c Mã hóa và giải mã

Mã hoá là bước cuối cùng trong hệ thống nén ảnh dựa trên biến đổi DCT Chuẩnnén ảnh JPEG hiện nay dùng phương pháp mã hoá Huffman, đây là phép mã hoákhông làm mất thông tin Phương pháp này dựa trên mô hình thống kê Dựa vào dữliệu gốc, người ta tính tần suất xuất hiện các hệ số Việc tính tần suất được thực hiệnbằng cách duyệt tuần tự từ đầu khối đến cuối khối, sau đó, những hệ số có tần suất caođược gắn cho một từ mã ngắn, các hệ số có tần suất thấp được gán một từ mã dài Vớicách thức này chiều dài trung bình của từ mã đã giảm xuống

Trang 32

Các hệ số thu được sau khi lượng tử hoá sẽ được sắp xếp thành một chuỗi các kýhiệu theo kiểu “zig-zag” (theo đường zig-zag trong hình 2.4) để đặt các hệ số có tần sốthấp lên trước các hệ số tần số cao Các hệ số này sẽ được mã hoá dựa trên bảng mãHuffman sao cho chiều dài trung bình của từ mã là nhỏ nhất Bảng mã này cũng sẽđược đặt trong phần mào đầu của ảnh để thực hiện giải nén ảnh.

2.1.6.2 Kỹ thuật mã hoá băng con

a Ý tưởng mã hoá băng con

Mặc dù với tất cả các ưu điểm của nén ảnh JPEG dựa trên biến đổi DCT như:tính toán đơn giản, chất lượng tốt và dễ dàng thực hiện về mặt phần cứng Nhưngphương pháp này cũng không hẳn là không có nhược điểm Vì ảnh đầu vào được phânchia thành nhiều khối độc lập, các khối này được thực hiện biến đổi DCT riêng chonên vẫn có tương quan ở dọc đường biên của các khối Điều này sẽ gây ra lỗi khối khithực hiện mã hoá với tốc độ bit thấp Trong một ảnh số, các thành phần tần số cao chủyếu tập trung ở vùng biên của ảnh, đấy là nơi mà các giá trị mức xám của các điểm ảnhcó độ chênh lệch lớn Mà trong đa số các ảnh, các chi tiết của ảnh thường thay đổichậm tức là chênh lệch mức xám giữa các điểm ảnh gần nhau nhỏ Như vậy có thể kếtluận rằng phổ tần của ảnh tập trung chủ yếu ở miền tần số thấp Trong các phươngpháp nén ảnh trước đây, việc mã hoá thực hiện trong toàn dải tần của ảnh, như vậy sẽgây dư thừa thông tin khi mã hoá trong miền tần số cao vì ở tần số cao không có nhiềuthông tin của ảnh Vì vậy, cần thiết phải đưa ra một phương pháp mới tối ưu hơn

Ý tưởng của phương pháp mã hoá băng con là chia dải tần số của ảnh thành nhiềudải tần con và mã hoá ở mỗi dải tần một số lượng bit khác nhau Ví dụ, ở dải tần sốcao số bit mã hoá sẽ không cần nhiều bằng ở miền tần số thấp Với phương pháp nàyhiệu quả nén sẽ tăng lên và nhiều khối cũng không xuất hiện nữa do không phải phânchia ảnh thành các khối để xử lí

b Mã hoá băng con

Nguyên tắc cơ bản trong quá trình mã hoá ảnh băng con là phân chia ảnh thànhnhiều dải tần số thông qua các bộ lọc thông thấp, thông dải và thông cao Các dải tầnnày gọi là các băng con Sau đó, các băng con này sẽ được lượng tử và mã hoá độc lậpnhau, tuỳ thuộc vào tính chất thống kê và mật độ năng lượng của từng dải mà số bit mãhoá khác nhau

Trang 33

Hình 2.5 a) Băng lọc phân tích; b) Hai bộ lọc thông thấp và thông cao

c) Phần vùng trong miền tần số; d) Băng lọc tổng hợp

Minh họa trên hình 2.5 (a) Gọi L và H tương ứng là các bộ lọc thông thấp vàthông cao một chiều Tần số 2 chiều của ảnh được tách ra từng chiều theo trục w1 vàw2 Hình 2.5 (c) mô tả băng lọc được phân thành 4 vùng tần số LL, LH, HL và HH.Vùng trung tâm (LL) là vùng có tần số thấp theo cả hai hướng Bốn góc (HH) là vùngcó các thành phần tần số cao theo cả hai hướng Bốn vùng bên cạnh (HL, LH) là cácvùng có tần số thấp và tần số cao, mỗi thành phần đi theo một hướng Chú ý đến các

hệ số 2 trong hình vẽ 2.5 (a), đó là thành phần giảm mẫu, nó có nhiệm vụ kéo dãnbăng tần của từng băng con để bằng với băng tần của ảnh gốc nhưng với tốc độ lấymẫu thấp hơn

Các vùng tần số gọi là các băng con sẽ được lượng tử hoá và mã hoá giống nhưvới biến đổi DCT Sau khi lượng tử, mã hoá, lưu trữ, truyền và giải mã ảnh, mỗi băngcon sẽ được tăng mẫu với hệ số 2 (hình 2.5 (d)) và thông qua các bộ lọc để loại bỏ các

Trang 34

thành phần chồng phổ (alias) của tín hiệu sinh ra do các bộ tăng mẫu Tất cả các băngnày sau đó được cộng lại để khôi phục lại ảnh ban đầu.

Trong thực tế, rất nhiều lỗi được tạo ra trong quá trình nén và truyền ảnh: lỗi dolượng tử hoá, do mã hoá, lỗi kênh truyền… bên cạnh đó, bản thân băng lọc còn gây ralỗi do phía thu không khôi phục lại được chính xác tín hiệu phát Do đó, nếu khôngquan tâm đến sự có mặt của các bộ mã hoá và kênh truyền thì trước tiên băng lọc phảicó tính khôi phục hoàn hảo tức là tín hiệu ra phải là một bản trễ nguyên gốc của tínhiệu đầu vào Điều này phụ thuộc vào việc thiết kế các bộ lọc trong băng lọc Có rấtnhiều các nghiên cứu để tìm ra các băng lọc thoả mãn tính khôi phục hoàn hảo Mộttrong những dạng như vậy là băng lọc gương cầu phương QMF (Quadrature MirrorFilter) với bộ lọc thông cao (H) là ảnh gương của bộ lọc thông thấp (L) qua trục П/2(hình 2.5 (b))

2.1.6.3 Biến đổi Wavelet trong nén ảnh

Biến đổi Wavelet

Wavelet là phép biến đổi được sử dụng để phân tích các tín hiệu không ổn định(non-stationary) – là những tín hiệu có đáp ứng tần số thay đổi theo thời gian

Biến đổi Wavelet được thực hiện theo cách: tín hiệu được nhân với hàm Waveletrồi thực hiện biến đổi riêng rẽ cho các khoảng tín hiệu khác nhau trong miền thời giantại các tần số khác nhau Cách tiếp cận như vậy còn được gọi là: phân tích đa phân giải– MRA (Multi Resolution Analysis): phân tích tín hiệu ở các tần số khác nhau và chocác độ phân giải khác nhau MRA khi phân tích tín hiệu cho phép: phân giải thời giantốt và phân giải tần số kém ở các tần số cao; phân giải tần số tốt và phân giải thời giankém ở các tần số thấp Như vậy kỹ thuật này rất thích hợp với những tín hiệu: có cácthành phần tần số cao xuất hiện trong khoảng thời gian ngắn, các thành phần tần sốthấp xuất hiện trong khoảng thời gian dài chẳng hạn như ảnh và khung ảnh video

Biến đổi Wavelet rời rạc (DWT)

Có thể hiểu phép biến đổi DWT như là áp dụng một tập các bộ lọc: thông cao vàthông thấp Thiết kế các bộ lọc này tương đương như kỹ thuật mã hoá băng con(subband coding) nghĩa là: chỉ cần thiết kế các bộ lọc thông thấp, còn các bộ lọc thôngcao chính là các bộ lọc thông thấp dịch pha đi một góc 1800 Tuy nhiên khác với mãhoá băng con, các bộ lọc trong DWT được thiết kế phải có đáp ứng phổ phẳng, trơn vàtrực giao

Trang 35

Các thủ tục nén gồm ba bước:

 Các hệ số chi tiết theo ngưỡng: Đối với mỗi mức phân tích từ 1 đến N đều

sử dụng một ngưỡng cho các hệ số chi tiết

Nén ảnh có hai phương pháp thực hiện Thứ nhất là giãn rộng Wavelet theo tínhiệu và lưu giữ chúng bởi một số lượng rất lớn các hệ số nguyên bản Trường hợpnày ta có thể thiết lập ngưỡng toàn cục và tất cả các mức phân tích đều sử dụngngưỡng này để thiết lập cho việc phân tích Phương pháp thứ hai là cho phép thiếtlập ngưỡng tự động có thể thay đổi giá trị tùy thuộc vào các mức

a Biến đổi Wavelet 1-D

Phân tích Wavelet 1-D

Bước phân tích: Tín hiệu được cho đi qua các bộ lọc thông cao và thông thấp rồiđược lấy mẫu xuống (down sampling) hệ số 2 tạo thành biến đổi DWT mức 1

Hình 2.6 minh họa quá trình phân tích Wavelet 1 chiều

Hình 2.6 Sơ đồ khối phân tích tín hiệu mức j

Biến đổi ngược Wavelet 1-D

Thực hiện biến đổi ngược, bắt đầu từ cAj và cDj, IDWT khôi phục cAj-1, đảongược các bước phân chia bằng việc chèn vào các giá trị 0 và kết hợp các kết quảvới các bộ lọc khôi phục

Ngày đăng: 30/04/2014, 21:28

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
2. Raphael C.Gonzalez , Richard E.Woods, Steven L.Eddins, “Digital Image Processing Using Matlab”, Prentice Hall, năm 2004 Sách, tạp chí
Tiêu đề: Digital Image Processing Using Matlab
4. ThS. Nguyễn Hoài Nam, “Các phương pháp sư dụng trong chuẩn nén ảnh JPEG”, Tạp chí Bưu chính viễn thông kì 1, tháng 3/2004 Sách, tạp chí
Tiêu đề: Các phương pháp sư dụng trong chuẩn nén ảnh JPEG
5. Nguyễn Việt Cường, “JPEG - JPEG2000: Những bước đi ngoạn mục của kỹ thuật nén hình ảnh”, báo OSGColtech/12gio/vietbao, 9/9/2004 Sách, tạp chí
Tiêu đề: JPEG - JPEG2000: Những bước đi ngoạn mục của kỹ thuật nén hình ảnh
6. TS. Nguyễn Thanh Bình, THS. Võ Nguyễn Quốc Bảo, “Xư lí âm thanh, hình ảnh”, dùng cho sinh viên hệ đại học từ xa, Học viện công nghệ Bưu chính Viễn thông, Hà Nội, năm 2007 Sách, tạp chí
Tiêu đề: Xư lí âm thanh, hình ảnh
7. PGS.TS Nguyễn Quang Hoan, “Xư lý ảnh”, dùng cho sinh viên hệ đại học từ xa, Học viện công nghệ Bưu chính Viễn thông, năm 2006 Sách, tạp chí
Tiêu đề: Xư lý ảnh

HÌNH ẢNH LIÊN QUAN

Hình 1.7 Cơ chế lọc không gian 1.2.5.1 Lọc làm mịn ảnh - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 1.7 Cơ chế lọc không gian 1.2.5.1 Lọc làm mịn ảnh (Trang 24)
Hình 2.2 Mô hình mã hóa dự đoán không tổn thất bao gồm bộ mã hóa và bộ giải mã - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 2.2 Mô hình mã hóa dự đoán không tổn thất bao gồm bộ mã hóa và bộ giải mã (Trang 33)
Hình 2.3 Sơ đồ mã hóa và giải mã dùng biến đổi DCT [4] - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 2.3 Sơ đồ mã hóa và giải mã dùng biến đổi DCT [4] (Trang 34)
Hình 2.5 a) Băng lọc phân tích; b) Hai bộ lọc thông thấp và thông cao c) Phần vùng trong miền tần số; d) Băng lọc tổng hợp - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 2.5 a) Băng lọc phân tích; b) Hai bộ lọc thông thấp và thông cao c) Phần vùng trong miền tần số; d) Băng lọc tổng hợp (Trang 38)
Hình 2.6 minh họa quá trình phân tích Wavelet 1 chiều. - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 2.6 minh họa quá trình phân tích Wavelet 1 chiều (Trang 40)
Hình 2.7 minh họa quá trình biến đổi ngược Wavelet 1 chiều. - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 2.7 minh họa quá trình biến đổi ngược Wavelet 1 chiều (Trang 41)
Hình 2.9 Sơ đồ biến đổi ngược Wavelet rời rạc 2-D - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 2.9 Sơ đồ biến đổi ngược Wavelet rời rạc 2-D (Trang 42)
Hình 2.8 Sơ đồ phân tích Wavelet rời rạc 2-D - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 2.8 Sơ đồ phân tích Wavelet rời rạc 2-D (Trang 42)
Hình 2.12 So sánh JPEG, JPEG2000 - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 2.12 So sánh JPEG, JPEG2000 (Trang 46)
Bảng 2.1 Số bit mỗi pixel - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Bảng 2.1 Số bit mỗi pixel (Trang 47)
Hình 2.14 Minh hoạ tính năng ROI - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 2.14 Minh hoạ tính năng ROI (Trang 48)
Hình 3.2 Giao diện chương trình biến đổi ảnh xám - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.2 Giao diện chương trình biến đổi ảnh xám (Trang 54)
Hình 3.3 Đồ thị của các giá trị trong hàm imadjust - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.3 Đồ thị của các giá trị trong hàm imadjust (Trang 55)
Hình 3.4 (a) Ảnh gốc – (b) Ảnh âm bản - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.4 (a) Ảnh gốc – (b) Ảnh âm bản (Trang 56)
Hình 3.6 (a) Ảnh gốc – (b) Ảnh biến đổi hàm mu - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.6 (a) Ảnh gốc – (b) Ảnh biến đổi hàm mu (Trang 57)
Hình 3.8 minh họa mô phỏng Matlab cho kĩ thuật cắt theo mức. Trong trường hợp có nền, tham số L = 0.8, a = 0.4, b = 0.6 - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.8 minh họa mô phỏng Matlab cho kĩ thuật cắt theo mức. Trong trường hợp có nền, tham số L = 0.8, a = 0.4, b = 0.6 (Trang 58)
Hình 3.9 (a) Ảnh gốc – (b) Biểu đồ ảnh gốc – (c) Ảnh cân bằng – (d) Biểu đồ của ảnh cân bằng - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.9 (a) Ảnh gốc – (b) Biểu đồ ảnh gốc – (c) Ảnh cân bằng – (d) Biểu đồ của ảnh cân bằng (Trang 59)
Hình 3.10 Hai ảnh xám gần giống nhau - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.10 Hai ảnh xám gần giống nhau (Trang 59)
Hình 3.11 Ảnh xám thu được trước và sau khi cân bằng (từ trái qua phải) 3.2.2.4 Chèn nhiễu - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.11 Ảnh xám thu được trước và sau khi cân bằng (từ trái qua phải) 3.2.2.4 Chèn nhiễu (Trang 60)
Hình 3.14 (a) Ảnh gốc – (b) Ảnh chèn nhiễu salt & pepper – (c) Ảnh lọc sử dụng ma trận H – (d) Ảnh lọc sử dụng bộ lọc trung bình - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.14 (a) Ảnh gốc – (b) Ảnh chèn nhiễu salt & pepper – (c) Ảnh lọc sử dụng ma trận H – (d) Ảnh lọc sử dụng bộ lọc trung bình (Trang 64)
Hình 3.16 (a) Ảnh gốc – (b) Ảnh chèn nhiễu salt & pepper – (c) Ảnh lọc không gian phi tuyến - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.16 (a) Ảnh gốc – (b) Ảnh chèn nhiễu salt & pepper – (c) Ảnh lọc không gian phi tuyến (Trang 66)
Hình 3.17 (a) Ảnh gốc – (b) Ảnh chèn nhiễu salt & pepper – (c) Ảnh lọc trung vị 3x3 - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.17 (a) Ảnh gốc – (b) Ảnh chèn nhiễu salt & pepper – (c) Ảnh lọc trung vị 3x3 (Trang 67)
Hình 3.20 (a) Ảnh gốc – (b) Ảnh chèn nhiễu poisson – (c) Ảnh lọc thông cao cơ bản - Lọc emphasis cao tần - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.20 (a) Ảnh gốc – (b) Ảnh chèn nhiễu poisson – (c) Ảnh lọc thông cao cơ bản - Lọc emphasis cao tần (Trang 68)
Hình 3.21 (a) Ảnh gốc – (b) Ảnh chèn nhiễu salt & pepper – (c) Ảnh lọc emphasis cao tần – (d) Ảnh lọc sau khi cân bằng mức xám - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.21 (a) Ảnh gốc – (b) Ảnh chèn nhiễu salt & pepper – (c) Ảnh lọc emphasis cao tần – (d) Ảnh lọc sau khi cân bằng mức xám (Trang 69)
Hình 3.23 Giao diện nén ảnh JPEG và JPEG2000 3.2.3.4 JPEG2000 - đồ án :XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH
Hình 3.23 Giao diện nén ảnh JPEG và JPEG2000 3.2.3.4 JPEG2000 (Trang 72)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w