1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu phương pháp lọc nhiễu ảnh và ứng dụng cho ảnh tài liệu

32 526 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 32
Dung lượng 859,55 KB

Nội dung

Do các nguyên nhân khác nhau có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến, do vậy cần phải tăng cường và khôi phục lại ảnh để làm nổi bậ

Trang 1

LÊ TRUNG THỨC

NGHIÊN CỨU PHƯƠNG PHÁP LỌC NHIỄU ẢNH

VÀ ỨNG DỤNG CHO ẢNH TÀI LIỆU

Chuyên ngành: Khoa học máy tính

Mã số: 60 48 01 01

LUẬN VĂN THẠC s ĩ MẤY TÍNH

Người hướng dẫn khoa học: PGS TS NGÔ QUỐC TẠO

HÀ NỘI, 2015

Trang 2

LỜI CẢM ƠN

Trong thời gian thực hiện luận văn thạc sỹ em đã nhận được rất nhiều

sự khích lệ, động viên, giúp đỡ từ phía thầy cô, cha mẹ và bạn bè xung quanh

Em xin gửi lời cảm on chân thành tới các thầy cô trong trường Đại học

Sư phạm Hà Nội 2, các thầy ở Viện Công nghệ thông tin đã truyền đạt vốn kiến thức quý báu cho chúng em

Em xin bày tỏ lòng biết ơn chân thành nhất tới thầy giáo, PGS.TS Ngô Quốc Tạo, người đã trực tiếp hướng dẫn em hoàn thành luận văn thạc sỹ này

Cảm ơn đề tài: " Hệ thống đeo tay hỗ trợ đọc sách tiếng Việt dành cho

người khiếm thị” Mã số VAST01.07/15-16 hỗ trợ trong thực hiện luận văn.

Em đã cố gắng học tập và hoàn thành luận văn thạc sỹ nhưng có thể luận văn thạc sỹ vẫn còn có những thiếu sót Em rất mong nhận được sự góp

ý, chỉ bảo của các thầy cô và các bạn để luận văn thạc sỹ hoàn thiện hơn

Hà nội, n g ày tháng năm 2015

Tác giả luận văn

Lề Trung Thức

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận văn này

là trung thực và không trùng lặp với các đề tài khác Tôi cũng xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc

Hà nội, n g ày tháng năm 2015

Tác giả luận văn

Lê Trung Thức

Trang 4

MỤC LỤC

LỜI CẢM Ơ N 1

LỜI CAM ĐOAN 2

DANH MỤC HÌNH VẼ 5

MỞ ĐẦU 6

CHƯƠNG I - KHÁI QUÁT VỀ x ử LÝ ẢNH VÀ LỌC NHIỄU Ả N H 9

1.1 Giới thiệu về xử lý ảnh 9

1.2 Những vấn đề cơ bản trong hệ thống xử lý ảnh 10

1.2.1 Những khái niệm cơ bản 10

1.2.1.1 Điểm ảnh (Picture Element) 10

1.2.1.2 Độ phân giải của ản h 10

1.2.1.3 Mức xám của ảnh 11

1.2.1.4 Ảnh số 12

1.2.1.5 Quan hệ giữa các điểm ảnh 12

1.2.2 Thu nhận ảnh 14

1.2.3 Tiền xử lý (Image Processing) 15

1.2.4 Những vấn đề khác trong xử lý ảnh 16

1.2.4.1 Biến đổi ảnh (Image Transform) 16

1.2.4.2 Nén ảnh 16

1.2.4.3 Các định dạng cơ bản trong xử lý ảnh 16

1.3 Bài toán lọc nhiễu ảnh 17

1.3.1 Bài toán 17

1.3.2 Giới thiệu về nhiễu ảnh 18

1.3.2.1 Một mô hình của quá trình suy thoái 18

1.3.2.2 Nhiễu 19

1.3.3 Khái niệm lọc nhiễu ảnh 24

CHƯƠNG 2 - CÁC KỸ THUẬT LỌC NHIỄU Ả N H 26

2.1 Kỹ thuật lọc trung bình 26

2.2 Kỹ thuật lọc thích nghi 28

2.3 Kỹ thuật lọc cấp độ thấp 29

Trang 5

2.4 Kỹ thuật lọc theo thứ t ự 30

2.5 Kỹ thuật lọc nghịch đảo 31

2.6 Kỹ thuật lọc Band Reject 34

2.7 Sử dụng bộ lọc Notch 35

2.8 Lựa chọn công cụ, ngôn ngữ lập trình 36

CHƯƠNG 3 - BÀI TOÁN LỌC NHIỄU CHO ẢNH TÀI LIỆU 41

3.1 Bài toán 41

3.2 Thử nghiệm chương trình lọc nhiễu muối tiêu và Gauss 41

3.2.1 Lọc cấp độ thấp 41

3.2.2 Lọc trung bình 42

3.2.3 Lọc theo thứ tự 44

3.3 Chương trình lọc nhiễu ảnh 45

3.3.1 Giao diện chính của chương trình 45

3.3.2 Các đoạn mã lệnh 45

3.4 Kết quả thử nghiệm chương trình lọc nhiễu ản h 49

KẾT LUẬN VÀ KIẾN NGHỊ 55

TÀI LIỆU THAM KHẢO 56

PHỤ LỤC 57

Trang 6

Hình 1.2 Ảnh gốc 20

Hình 2.6 “phân chia hạn chế’’ : chọn ngưỡng giá trị d 34

Hình 3.3 Giao diện chính của chương trình lọc nhiễu ảnh 45

Hình 3.6 Lọc trung bình mặt nạ 3x3 loại bỏ nhiễu Gauss 50 Hình 3.7 Lọc trung bình mặt nạ 5x5 loại bỏ nhiễu Gauss 51 Hình 3.8 Lọc tương thích mặt nạ 5x5 loại bỏ nhiễu Gauss 51 Hình 3.9 Lọc tương thích mặt nạ 7x7 loại bỏ nhiễu Gauss 51 Hình 3.10 Lọc tương thích mặt nạ 9x9 loại bỏ nhiễu Gauss 52

Hình 3.13 Lọc cấp độ thấp mặt nạ 3x3 loại bỏ nhiễu muối - tiêu 53 Hình 3.14 Lọc cấp độ thấp mặt nạ 5x5 loại bỏ nhiễu muối - tiêu 53 Hình 3.15 Lọc theo thứ tự mặt nạ 3x3 loại bỏ nhiễu muối - tiêu 53 Hình 3.16 Lọc theo thứ tự mặt nạ 5x5 loại bỏ nhiễu muối - tiêu 54

Trang 7

MỞ ĐẦU

1 Lý do chọn đề tài

Trong những năm gần đây công nghệ thông tin phát triển với tốc độ nhanh chóng cả về phần cứng và phần mềm Sự phát triển của công nghệ thông tin đã thúc đẩy sự phát triển của nhiêu lĩnh vực xã hội khác như: y học, giáo dục, giải trí, kinh tế vv Sự phát triển của phần cứng cả về phương diện thu nhận, hiển thị, cùng với tốc độ xử lý đã mở ra nhiều hướng mới cho sự phát triển phần mềm, đặc biệt là lĩnh vực xử lý ảnh cũng như công nghệ thực tại ảo đã ra đời và thâm nhập mạnh mẽ vào đời sống của con người

Ảnh thu được sau qua trình thu nhận ảnh hoặc các phép biến đổi không tránh khỏi nhiễu hoặc khuyết thiếu Sự sai sót này một phần bởi các thiết bị quang học và điện tử, phần khác bởi bản thân các phép biến đổi không phải là toàn ánh, nên có sự ánh xạ thiếu hụt đến những điểm trên ảnh kết quả.Việc khắc phục các nhược điểm này luôn là vấn đề đặt ra cho các hệ thống xử lý ảnh

Các hệ xử lý ảnh trong quá trình phân tích ảnh, tăng cường ảnh để nâng cao chất lượng ảnh Do các nguyên nhân khác nhau có thể do chất lượng thiết

bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến, do vậy cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc, trạng thái trước khi ảnh bị biến dạng

Xuất phát trong hoàn cảnh đó “Nghiên cứu phương pháp lọc nhiễu ảnh

và ứng dụng cho ảnh tài ỉiệứ'’ được em chọn làm đề tài.

2 Mục đích nghiên cứu

Mục đích chính của đề tài là:

- Nghiên cứu về nhiễu ảnh, một số phương pháp lọc nhiễu ảnh

Trang 8

- Sử dụng một ngôn ngữ để triển khai xây dựng chương trình mô phỏng một số phương pháp lọc nhiễu ảnh

3 Nhiệm vụ nghiên cứu

Tìm hiểu khái quát về xử lý ảnh

Tìm hiểu các phương pháp lọc nhiễu ảnh

- Xây dựng chương trình ứng dụng của các phương pháp trên

5 Phương pháp nghiên cứu

Thu thập tài liệu, phân tích, suy luận, tổng hợp, đánh giá Từ đó đề xuất

nghiên cứu và tìm hiểu: “Nghiên cứu phương pháp lọc nhiễu ảnh và ứng

dụng cho ảnh tài ỉiệứ'’

6 Kết quả đạt được

Trên cơ sở các kiến thức đã thu thập và nghiên cứu: Xây dựng được ứng dụng thực tế lọc nhiễu cho ảnh phong cảnh, ảnh tài liệu

Trang 9

NỘI DUNG Chương 1: Khái quát về xử lỷ ảnh và lọc nhiễu ảnh

1.1 Giới thiệu về xử lý ảnh

1.2 Các vấn đề cơ bản trong hệ thống xử lý ảnh

1.3 Bài toán lọc nhiễu ảnh

Chương 2: Các kỹ thuật lọc nhiễu ảnh

2.8 Lựu chọn công cụ, ngôn ngữ lập trình

Chương 3: Bài toán lọc nhiễu cho ảnh tài liệu

Trang 10

CHƯƠNG I - KHÁI QUÁT VÈ x ử LÝ ẢNH VÀ LỌC NHIỄU ẢNH

1.1 Giới thiệu về xử ỉý ảnh

Xử lý ảnh là một lĩnh vực đang được quan tâm nghiên cứu và có nhiều ứng dụng quan trọng trong thực tế cùng với sự phát triển của công nghệ thông tin, thúc đẩy các ngành kinh tế, xã hội khác phát triển Mục đích chính của xử

lý ảnh có thể nêu ra như sau:

• Xử lý ảnh ban đầu để có được ảnh mới theo một yêu cầu xác định (Ví dụ như ảnh mờ, cần xử lý để được ảnh rõ hơn)

• Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại, nhận biết ảnh (Ví dụ: phân tích ảnh vân tay để trích chọn đặc trưng vân tay, nhận dạng chữ viết, nhận dạng tài liệu )

• Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn, sâu hơn (Ví dụ: từ ảnh một tai nạn giao thông, phác hoạ hiện trường tai nạn)

Một ảnh trong thế giới thực được xem như là một hàm hai biến thực a(x,y), với a là độ sáng của ảnh tại vị trí toạ độ thực (x,y) Một ảnh còn có thể chứa những ảnh con gọi là các “vùng quan tâm” (ROI - Region Of Interest) Các ROI này vẫn thường được gọi tắt là các “vùng” Khái niệm vùng phản ánh một thực tế là trong ảnh thường chứa nhiều đối tượng, mỗi đối tượng tạo nên phần cơ sở của một vùng Đối với một hệ xử lý ảnh cao cấp, chúng ta có thể áp dụng nhiều phép toán cho từng vùng ảnh một, ví dụ như một vùng ảnh này sẽ được áp dụng các phép toán loại bỏ hiệu ứng mờ do chuyển động, trong khi một vùng ảnh khác sẽ được xử lý để nâng cao chất lượng màu sắc của nó

Các giá trị độ sáng của ảnh thường được thể hiện dưới dạng số thực hoặc số nguyên Thông thường, những giá trị sáng kiểu số nguyên là kết quả của một quá trình lượng hoá chuyển một thang đo liên tục thành một số mức

Trang 11

rời rạc Tuy nhiên trong nhiều quá trình hình thành ảnh, độ lớn của tín hiệu là kết quả đếm số hạt photon ở từng thời điểm, do vậy độ lớn ấy dĩ nhiên đã được lượng hoá sẵn Còn trong một số quá trình tạo ảnh khác, ví dụ như tạo ảnh siêu âm trong y khoa, phương pháp đo đạc vật lý trực tiếp sẽ cho ra các giá trị phức, mỗi giá trị phức này gồm một giá trị độ lớn kết họp với một giá trị pha, và cả hai đều ở dạng số thực.

1.2 Những vấn đề cơ bản trong hệ thống xử ỉý ảnh

1.2.1 Những khái niệm cơ bản

1.2.1.1 Điếm ảnh (Picture Element)

Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng

Để xử lý bằng máy tính (số), ảnh cần phải được số hóa số hóa ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù họp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy được gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel Trong khuân khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x,y)

Định nghĩa:

Điểm ảnh (Pixel) là một phần tử của ảnh số tại tọa độ (x,y) với độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật.Mỗi phần tử trong ma trận được gọi là một phần tử ảnh

1.2.1.2 Độ phân giải của ảnh

Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh

đươc ấn đinh trên ảnh số đươc hiển thi

Trang 12

Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích họp tạo nên một mật độ phân bố, đó chính là độ phân giải và được phân

bố theo trục X và y trong không gian hai chiều

Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Grraphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc *

200 điểm ảnh (320*200) Rõ ràng cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA 17” độ phân giải 320*200 Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm ảnh) kém hơn

1.2.1.3 Mức xám của ảnh

Một điểm ảnh (Pixel) có hai đặc trưng cơ bản là vị trí (x,y) của điểm ảnh và độ xám của nó Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng trong xử lý ảnh

a) Định nghĩa: Mức xám của điểm ảnh là cường độ sáng của nó được

gán bằng giá trị số tại điểm đó

b) Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256

(Mức 256 là mức phổ dụng Lý do từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng 1 byte để biểu diễn 28 = 256 mức, tức là

từ 0 đến 255)

c) Ảnh đen trắng: là ảnh có 2 màu đen, trắng (không chứa màu khác)

với mức xám ở các điểm ảnh có thể khác nhau

d) Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit

mô tả 21 mức khác nhau Nói cách khác mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1

Trang 13

e) Ảnh màu: trong khuân khổ lý thuyết 3 màu (Red, Blue, Green) để

tạo nên thế giới màu, ngưới ta thường dùng 3 byte để mô tả mức màu, khi đó

các giá trị màu 28*3=224 triệu màu

1.2.1.4 Ảnh số

Định nghĩa: Ảnh số là tập họp các điểm ảnh với mức xám phù họp

dùng để mô tả ảnh gần với ảnh thật

1.2.1.5 Quan hệ giữa các điếm ảnh

Một ảnh số giả sử được biểu diễn bằng hàm f(x,y) Tập con các điểm

ảnh là S; cặp điểm ảnh có quan hệ với nhau là p,q Đe thể hiện quan hệ giữa

các điểm ảnh chúng ta có một số khái niệm sau:

a) Các lân cận của điểm ảnh (Image Neighbors)

Giả sử có điểm ảnh p tại tọa độ (x,y) p có 4 điểm lân cận gần nhất theo

chiều đứng và ngang (có thể coi lân cận 4 hướng chính : Đông, Tây, Nam,

Bắc)

{(x-l,y);(x,y-l);(x,y+l);(x+l,y)Ị = N4(p)Trong đó: số 1 là giá trị logic; N4(p) là 4 điểm lân cận của p

Hình 1.1 Lân cận các điểm ảnh của tọa độ (x,y)

Các lân cận chéo: Các điểm lân cận chéoNp(p) (có thể coi lân cận chéo

là 4 hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)

Np(p) = {(x+l,y+l);(x+l,y-l);(x-l,y+l);(x-l,y-l)}

Trang 14

Tập kết họp: Ng(p) = N4(p) +Np(p) là tập họp 8 lân cận của điểm ảnh pChú ý: Nếu (x,y) nằm ở biên (mép) ảnh; một số điểm sẽ nằm ngoài ảnh.

b) Các mối liên kết điểm ảnh

Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của đối tượng vật thể hoặc xác định vùng trong một ảnh Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng

Giả sử V là tập các giá trị mức xám Một tập có các giá trị cường độ sáng từ thang mức xám từ 32 đến 64 được mô tả như sau:

c) Đo khoảng cách giữa các điểm ảnh

Định nghĩa: Khoảng cách D(p,q) giữa hai điểm ảnh p tọa độ (x,y), q

tọa độ (s,t) là hàm khoảng cách (Distance) hoặc Metric nếu:

1 D(p,q) > 0 (Với D(p,q)=0 nếu và chỉ nếu p=q)

2 D(p,q) = D(q,p)

3 D(p,z) <D(p,q) + D(q,z); z là một điếm ảnh khác.

Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x,y)

và q(s,t) được định nghĩa như sau:

Trang 15

De(p,q) = [(x-s)2 + (y-t)2]1“

Khoảng cách khối: Khoảng cách D4(p,q) được gọi là khoảng cách khối

đồ thị (City-Block Distance) và được xác định như sau:

D4(p>q) = lx-sl + ly-tlGiá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa điểm ảnh từ tâm điểm ảnh đến tâm điểm ảnh q khác Ví dụ: Màn hình CGA 12” (12”*2,54cm = 30,48cm = 304,8mm) độ phân giải 320*200; tỷ lên 4/3 (chiều dài/chiều rộng) Theo định lý Pitago về tam giác vuông, đường chéo sẽ lấy tỷ

lệ 5 phần (5/4/3: đường chéo/chiều dài/chiều rộng màn hình); khi đó độ dài thật là (305/244/183) chiều rộng màn hình 183mm tương ứng với màn hình CGA 200 điểm ảnh theo chiều dọc Như vậy, khoảng cách điểm ảnh lân cận của CGA 12” là Imm

Khoảng cách Dg(p,q) còn gọi là khoảng cách bàn cờ (Chess-Board Distance) giữa điểm ảnh (p,q) được xác định như sau:

Nhìn chung các hệ thống thu nhận ảnh thực hiện 1 quá trình

- Cảm biến: biến đổi năng lượng quang học thành năng lượng điện

- Tổng hợp năng lượng điện thành ảnh

Trang 16

1.2.3 Tiền x ử lý (Image Processing)

Sau bộ thu nhận, ảnh có thể nhiễu độ tuơng phản thấp nên cần đưa vào

bộ tiền xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn

Mục đích của các công việc này là làm cho chất lượng ảnh trở lên tốt hơn chuẩn bị cho các bước xử lý tiếp theo

Khử nhiễu: Nhiễu được chia thành hai loại là nhiễu hệ thống và nhiễu

ngẫu nhiên Đặc trưng của nhiễu hệ thống là tính tuần hoàn Do vậy, có thể khử nhiễu hệ thống bằng việc sử dụng phép biến đổi Fourie và loại bỏ các đỉnh điểm Đối với nhiễu ngẫu nhiên, trường họp đơn giản là các vết bẩn tương ứng với các điểm sáng hay tối thì có thể khử bằng phương pháp nội suy, lọc trung vị và lọc trung bình

Chỉnh độ tương phản: Công việc cụ thể là chỉnh sửa tính không đồng

đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh

Nâng cao chất lượng ảnh: Nâng cao chất lượng ảnh nhằm hoàn thiện

một số đặc tính của ảnh như:

- Lọc nhiễu hay làm trơn ảnh

- Tăng độ tương phản, điều chỉnh mức xám của ảnh

- Làm nổi biên ảnhCác thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên các kỹ thuật trong miền điểm, không gian và tần số Toán tử điểm là phép biến đổi đối với từng điểm ảnh đang xét, không liên quan đến các điểm lân cận khác trong khi đó toán tử không gian sử dụng các điểm lân cận để quy chiếu đến điểm đang xét, một số phép biến đổi có tính toán phức tạp được chuyển sang miền tần số để thực hiện, kết quả cuối cùng được chuyển trở lại miền không gian nhờ các biến đổi ngược

Ngày đăng: 19/06/2016, 20:01

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w