HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
DO ĐĂNG HOAT
NGHIÊN CỨU PHÉP TOÁN HÌNH THÁI VA UNG DUNG NANG CAO CHAT LƯỢNG ANH NHI PHAN
CHUYÊN NGÀNH : HE THONG THONG TIN
MA SO _ : 60 48 01 04
HA NỘI - 2015
Trang 2Luận văn được hoàn thành tại:
Người hướng dẫn khoa học: PGS TS NGO QUOC TẠO
Phản biện 1: PGS.TS Ngô Thành Long
Phản biện 2: TS Đào Đình Khả
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học
viện công nghệ Bưu Chính Viễn Thông
Vào lúc: 10 giờ 30’ ngày 27 tháng 02 năm 2016
Có thê tìm hiéu luận văn tại:
- _ Thư viện của Học viện công nghệ Bưu Chính Viễn Thông
Trang 3LỜI MỞ ĐẦU
Trong thực tế hình dang thường được chú trọng hơn kích thước và con người nhận ra
các đối tượng xung quanh cũng chủ yếu thông qua hình ảnh Hình ảnh là một dang đữ liệu
đóng vai trò quan trọng trong việc trao đổi, xử lý, lưu giữ thông tin Có nhiều phương pháp, nhiều công cụ, nhiều phần mềm xử lý ảnh đã ra đời Tăng cường chất lượng ảnh, mà
công đoạn đầu tiên là một bước tiền xử lý nhằm xác định ảnh, khắc phục những khiếm
khuyết do bước thu nhận ảnh không tốt là việc làm quan trọng Có nhiều phương pháp cho việc nâng cao chất lượng ảnh nói chung và tiền xử lý nói riêng Trong luận văn này em chỉ mô tả một vài phương pháp tiền xử lý hình ảnh (chú trọng đến ảnh nhị phân, bởi ảnh của các bản vẽ kỹ thuật và sách scan thường chi là ảnh 2 màu: den, trang) nhằm cải thiện chất lượng hình anh bằng các thao tác Hình thái học (Morphology) dé ứng dụng vào chương trình nang
cao chat lượng ảnh Scan.
Các thao tác Hình thái học nói chung, đặc biệt là Hình thái học số được sử dụng chủ
yếu vào việc cải thiện ảnh bằng cách làm rõ (tái hiện) những nét đặc trưng của các hình
dạng, do vậy mà có thể tính toán được hay nhận biết được chúng một cách dễ dàng Việc sử dụng các thao tác hình thái và ứng dụng của chúng, đặc biệt là ứng dụng nâng cao chất lượng hình ảnh cho bước tiền xử lý, trước khi thực hiện những bước kế tiếp cho công việc
xử lý anh.
Chính vì vậy em đã lựa chọn luận văn “ Nghiên cứu phép toán hình thái và ứng
dụng nâng cao chất lượng ảnh nhị phân”.
Mục tiêu của luận văn là tìm hiểu nghiên cứu một sỐ kỹ thuật nâng cao chất lượng
ảnh nhị phân đặc biệt là phép toán hình thái học vào xử lý các đối tượng trong hình ảnh và xây dựng chương trình ứng dụng thực tế.
Báo cáo luận văn được chia làm 3 chương:
Chương I Tổng quan về phương pháp nâng cao chất lượng ảnh:
Chương II Ứng dụng phép toán hình thái trong nâng cao chất lượng ảnh nhị
Chương III Kiém nghiệm và đánh giá
Trang 4CHƯƠNG 1 TONG QUAN VE PHƯƠNG PHÁP NÂNG CAO
CHAT LƯỢNG ANH
Trong ngành khoa hoc máy tính, xử ly ảnh là một dang của xử lý tín hiệu cho đầu vào là một ảnh hoặc các frame của phim ảnh Đầu ra có thé là một hình ảnh, hoặc tập hợp các ký tự hoặc các tham số liên quan tới hình ảnh Thường thì kỹ thuật xử lý ảnh có liên quan tới xử lý tín hiệu hai chiều va được áp dụng bằng một chuẩn riêng về kỹ thuật xử lý ảnh cho nó Các khái niệm cơ bản dé xử lý tín hiệu như, khái niệm về tích chập, các biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn Ngoài ra còn cần tới các công cụ toán học như đại số tuyến tính, xác xuất, thống kê Và một số kiến thức cần thiết như trí tuệ nhân tao, mạng noron nhân tạo cũng được đề cập trong quá trình phân tích và nhận dạng ảnh.
1.1 Giới thiệu chung về xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan
trọng nhất Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống Xử lý ảnh và đồ
hoạ đóng một vai trò quan trọng trong tương tác người máy
Xử lý ảnh bao gồm các phương pháp va kỹ thuật dé biến đổi, dé truyền tải hoặc mã hóa các ảnh tự nhiên Mục đích của xử lý ảnh gồm:
Thứ nhất, biến đổi ảnh và làm đẹp ảnh.
Thứ hai, tự động nhận dang ảnh hay đoán nhận ảnh và đánh giá các nội dung củaảnh.
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dang theo tham số).
- Mô tả theo cau trúc(nhận dang theo cấu trúc).
Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác Dựa vào đó ta có thể
mô tả câu trúc của hình ảnh ban đâu.
Trang 5Có thé liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh Kỹ thuật này được sử dụng nhiều trong y học (xử lý tế bào, nhiễm sắc thể).
Trong thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối
tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu).
Nhận dạng chữ In hoặc đánh máy trong văn bản phục vụ cho việc tự động hoá quá trình đọc
tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính, nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiêu chữ, ).
Các quá trình của xử lý ảnh:
Các quá trình của xử lý ảnh [3] được tiến hành theo sơ đồ sau:
Thu Số hoá Phân Nhận
A" nhan anh tich anh dang
quyết định
Hình 1.1: Các giai đoạn chính trong xử lý ảnh
Trước hết là quá trình thu nhận ảnh Ảnh có thé thu nhận qua camera, vệ tinh, may
Tiếp theo là quá trình số hóa (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu
rời rac (lấy mẫu) va số hóa bằng lượng hóa, trước khi chuyên sang giai đoạn xử lý, phân tích
hay lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ Trước hết là công việc tăng cường hình ảnh (Image Enhancement) dé nâng cao chất lượng hình anh Do những nguyên nhân khác nhau: có thể do thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thé bị suy biến Do vậy cần phải tăng cường và khôi phục (Image Restoration) lại ảnh dé làm nỗi bật một số đặc tính chính của anh, hay làm cho ảnh gần giống với trạng thái gốc -trạng thái trước khi ảnh bị biến dạng Giai đoạn tiếp theo là phát hiện các đặc tính như biên
Trang 6(Edge Detection), phân vùng ảnh (Image Segmentation), trích chọn các đặc trưng (Feature
Cuối cùng, tuỳ theo mục dich của ứng dụng, sé là giai đoạn nhận dang, phan lớp hay
các quyết định khác Các giai đoạn chính của quá trình xử lý ảnh có thé mô tả ở hình 1.1
1.2 Một số van đề trong xử lý ảnh
1.2.1 Các khái niệm cơ bản
Phần tử ảnh (Pixel - Picture Element) Anh trong thuc tế là một ảnh liên tục về không gian và về giá trị độ sáng.
Đề có thể xử lý bằng máy tính cần thiết phải tiến hành số hóa ảnh Trong quá trình số
hóa người ta biến đổi từ tín hiệu liên tục sang tín hiệu rời rac thông qua quá trình lay mau (rời rạc hóa về không gian) và lượng hóa thành phần về giá trị mà về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau Trong quá trình này người ta sử dụng khái niệm Picture element mà ta quen gọi hay viết là Pixel Vậy 1 anh là một tập hợp các pixel.
Mức xám (Gray level) là kết quả sự mã hóa tương ứng với một cường độ sáng của mỗi điểm ảnh với một giá trị số - kết quả của quá trình lượng hóa Cách mã hóa kinh điển
thường dùng 16, 32 hay 64 mức Mã hóa 256 mức là phô dụng nhất do lý do kĩ thuật Vì 2°
= 256 (0,1, 255), nên với 256 mức, mỗi pixel sẽ được mã hóa bởi 8 bit.
Độ phân giải (Resolation) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiền thị Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng dé mô tả ảnh gần
với ảnh thật.
Ảnh nhị phân là ảnh chi có hai mức xám 0 và 1.
Ảnh màu là ảnh số trong đó cường độ điểm ảnh là sự tổng hợp từ các màu tùy theo từng loại mà có cách biéu diễn khác nhau.
Ảnh đa mức xám là ảnh có nhiều hơn hai mức xám.
1.2.2 Biểu diễn ảnh
Trong biểu diễn ảnh, người ta thường dùng các phan tử đặc trưng của ảnh là pixel Nhìn chung có thể một ham hai biến chứa các thông tin như biéu diễn của một ảnh Các mô hình biéu dién cho ta một mô tả logic hay định lượng các tính chất của hàm này Trong biéu
diễn ảnh cần chú ý đến tính trung thực hoặc các tiêu chuẩn “thông minh” dé đo chất lượng
Trang 7ảnh hoặc tính hiệu quả của các kĩ thuật xử lý Một số mô hình thường được dùng trong biểu diễn ảnh: mô hình bài toán, mô hình thống kê Trong mô hình bài toán, ảnh hai chiều được biểu diễn nhờ các hàm hai biến trực giao gọi là các hàm cơ sở Còn mô hình thống kê, một ảnh được coi như một phần tử của một tập hợp đặc trưng bởi các đại lượng như: kỳ vọng
toán học, hiệp biến, phương sai, moment 1.2.3 Biến doi ảnh (Image Transform)
Thuật ngữ biến đổi ảnh thường dùng dé nói tới một lớp các ma trận don vị va các kĩ thuật dùng dé biến đổi ảnh Biến đổi ảnh nhằm làm giảm các nguyên nhân của ảnh dé việc
xử lý hiệu quả hơn Như làm rõ hơn các thông tin mà ngời dùng quan tâm nhưng người
dùng phải chấp nhận mắt đi một số thông tin cần thiết.
1.2.4 Phân tích ảnh
Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của | anh để đưa ra
một mô tả đầy đủ về ảnh Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ.
Trước hết là công việc tăng cường ảnh để nâng cao chất lượng ảnh, giai đoạn tiếp theo là
phát hiện các đặc tính như phát hiện biên, phân vùng ảnh, trích chọn các đặc tinh v.v
1.2.4.1 Tăng cường ảnh — khôi phục anh
1.2.4.2 Biên
1.2.4.3 Phan vùng
1.2.5 Nhận dạng anh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng Có hai kiểu mô tả đối tượng: Mô tả tham số (nhận dạng theo tham số) Mô tả theo cấu trúc (nhận dạng theo cấu trúc) Trên thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ viết.
1.2.6 Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi trên mang mà lượng thông tin để biểu diễn cho một ảnh là rất lớn Do đó làm giảm lượng thông tin hay nén dit liệu là một nhu cau cần thiết Nén dé liệu là quá trình làm giảm lượng thông tin “ du
Trang 8thừa” trong dit liệu gốc và do vậy lượng thông tin thu được sau khi nén thường nhỏ hon dữ liệu gốc rất nhiều.
1.3 Các kỹ thuật nâng cao chất lượng ảnh
1.3.1 Các kỹ thuật không phụ thuộc không gian
1.3.1.1 Giới thiệu
Các phép toán không phụ thuộc không gian là các phép toán không phục thuộc vi trí
của điểm ảnh.
Ví dụ: Phép tăng giảm độ sáng , phép thống kê tần suất, biến đổi tần suất v.v
Một trong những khái niệm quan trọng trong xử lý ảnh là biểu đồ tần suất
Trang 91.3.1.5 Cân bằng histogram
1.3.1.6 Kỹ thuật tách ngưỡng tự động
1.3.1.7 Biến đôi cấp xám tong thé
1.3.2 Các kỹ thuật phụ thuộc không gian 1.3.2.1 Phép cuộn và mẫu
1.3.2.2 Một số mẫu thông dụng
1.3.2.3 Lọc trung vi
* Định nghĩa 2.1 (Trung vi): Cho dãy x1; x2 ; xn đơn điệu tăng (giảm) Khi đó
trung vị của dãy ký hiệu là Med({xn}), được định nghĩa:
®Ir—x, > min tại Med({x, })
1.3.2.4 Loc trung binh
* Dinh nghia 2.2 (Trung binh): Cho day x1, x2 , xn khi do trung binh cua day kyhiệu AV({xn}) được định nghĩa:
Trang 101.3.3 Các phép toán hình thái.
Ý nghĩa của “Morphology” là hình thái học và cấu trúc của đối tượng, hay nó mô tả những phạm vi và các mối quan hệ giữa các thành phần trong một đối tượng.
Phần lớn các phép toán hình thái học được định nghĩa từ hai phép toán cơ bản là
phép toán co nhị phan (Erosion) và phép toán giãn nhị phan (Dilation)
1.3.3.1 Phép giãn nhị phân (Dilation[4])
Phép giãn nhị phân của tập hợp A bởi phan tử cau trúc B là tập hợp của tat cả các điểm z (z là tâm điểm của phan tử cấu trúc B trên tập hợp A) sao cho phản xa của Ö, giao với tập A tại ít nhất một điểm
Với A và B là các tập hợp trong 2’, thì phép giãn nhị phân của A theo 8 (A®B) được
định nghĩa qua công thức sau:
A98 |8) ¬aze]
1.3.3.2 Phép co nhị phân (Erosion{ 4]).
Phép co nhị phân của tập hợp A bởi phan tử cấu trúc B được kí hiệu AOB và viết
dưới dạng công thức như sau:
AOB = {zl(B), cA}
Với 8 ={b+z,beB}1.3.3.3 Phép mở ảnh (Opening[4]).
Dé thực hiện phép mở ảnh ta phải trải qua hai giai đoạn là co ảnh và giãn anh Dau tiên sử dụng phép co và phần tử cấu trúc có kích thước tương ứng để tác động lên đối tượng trong ảnh đúng theo yêu cầu Tương tự với phép giãn nhị phân ta sẽ thu được kết quả.
Với tập hop A là đối tượng trong hình anh và B là phan tử cấu trúc, (s ) là ký hiệu của phép mở ảnh giữa tập hop A và phần tử cấu trúc B, phép mở ảnh được xác định bởi công
Ao 8=(1O BOB,
Trang 111.3.3.4 Phép đóng ảnh (Closing[4])
Với tập hợp A là đối tượng trong anh, B là phan tử cấu trúc (e) là ký hiệu phép đóng ảnh Khi đó phép đóng ảnh của tập hợp A bởi Phan tử cấu trúc B, kí hiệu là (Ae B), xác định
(AeB)=(A@B)OB
Trang 131.4 Kết luận
Chương này tìm hiểu tổng quan về các phương pháp nâng cao chất lượng ảnh
bao gồm có các khái niệm ban đầu về xử lý ảnh, các kỹ thuật nâng cao chất lượng ảnh phụ
thuộc và không phụ thuộc không gian Ngoai ra nội dung chương còn trình bay các thuật
toán xử lý hình thái học cơ bản như: phép co ảnh, phép giãn ảnh, phép mở ảnh, phép đóng
ảnh Thông qua nội dung chương, người đọc bước đầu có được các kiến thức chung trong lĩnh vực xử lý ảnh, các kỹ thuật nâng cao chất lượng ảnh và một số phép toán hình thái cơ
bản.
Trang 14CHƯƠNG II UNG DỤNG PHÉP TOÁN HÌNH THÁI TRONG
NÂNG CAO CHAT LƯỢNG ANH NHI PHAN
Hình ảnh trong thực tế khi nhận được qua các thiết bi như: Photocopy, Fax, ít nhiều đều bị nhiễu, thậm chí có thé biến dạng đến mức độ có thé khiến người nhận được hiểu sai về mặt ý nghĩa Dé giải quyết bài toán này như: nối liền những nét đứt, nối liền chữ, làm
trơn biên ảnh các phép toán hình thái nhị phân đã ra đời, thông qua các phép toán cơ bản
như phép giãn ảnh, phép co ảnh, phép đóng ảnh, mở ảnh để giải quyết bài toán nêu trên.
2.1 Khái niệm cơ bản
Phép toán cơ sở được kết hợp với một đối tượng là tiêu chuẩn của các phép toán tập
hợp như phép hợp (Union), Phép giao (InterSection), và phép bù (Complement) cộng với
phép tịnh tiến nào đó.
Đối với ảnh nhị phân, phần tử cấu trúc là một ảnh có kích thước nhỏ gồm có hai giá trị 0 và
1, các giá trị bằng 0 được bỏ qua trong quá trình tính toán,
2.2 Các phép toán Logic liên quan đến ảnh nhị phân
Các phép toán logic được sử dụng trong xử lý anh là AND(A), OR(v ), và NOT(¬)
Các phép toán đó cung cấp đầy đủ các chức năng, chúng có thể được kết hợp dưới bất kỳ
dạng nào của phép toán logic.
2.3 Một số tinh chat của phép toán hình thái
Đề thuận tiện trong việc cài đặt ta có thê phân tích và đơn giản hóa các mẫu phức tạp,
dưới đây là một số tính chất cơ sở của phép toán hình thái.
Trang 15a) X®(8LB)=(X ®B)L)(X OB),
b) X O(BUB')=(X OB)U(X OB’),
- Mệnh dé 3: Tính chat phân phối với phép giao
Giả sử, X là một đối tượng trong ảnh, B là phần tử cấu trúc, khi đó X sẽ bị chặn trên
và chặn dưới bởi tập close của X theo B.
2.4 Phép Biến déi trúng hoặc trượt (Hit-or-Miss)
Phép biến đổi “trúng hoặc trượt” được đưa ra bởi Serra [7] và là một công cụ cơ bản
để ứng dụng vào phát hiện hình dạng của đối tượng.
2.5 Các ứng dụng cơ bản của hình thái học
Ứng dụng chủ yếu của hình thái học đối với ảnh nhị phân là phân tích các thành phần
của ảnh, chính vì nó rất có hiệu quả trong biểu diễn và mô tả hình dạng đối tượng cho nên
phần này sẽ tập trung đưa ra các thuật toán về hình thái [1] để trích đường biên, các thành phần liên thông, đường bao lỗi, hay tìm xương làm mảnh.
2.5.1 Trích biên ( Boundary Extraction)
Biên của tập hợp A phụ thuộc vào kích thước của phần tử cấu trúc Độ dày của đường viền bao quanh đối tượng phụ thuộc vào kích thước cua phần từ cau trúc Ví dụ, nếu