Trong luận văn này em chỉ mô tả một vài phương pháp tiền xử lý hình ảnh chú trọng đến ảnh nhị phân, bởi ảnh của cácbản vẽ kỹ thuật và sách scan thường chi là ảnh 2 màu: den, trang nhằm c
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Trang 2Luận văn được hoàn thành tại:
Người hướng dẫn khoa học: PGS TS NGO QUOC TẠO
Phản biện 1: PGS.TS Ngô Thành Long
Phản biện 2: TS Đào Đình Khả
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học
viện công nghệ Bưu Chính Viễn Thông
Vào lúc: 10 giờ 30’ ngày 27 tháng 02 năm 2016
Có thê tìm hiéu luận văn tại:
- _ Thư viện của Học viện công nghệ Bưu Chính Viễn Thông
Trang 3LỜI MỞ ĐẦU
Trong thực tế hình dang thường được chú trọng hơn kích thước và con người nhận ra
các đối tượng xung quanh cũng chủ yếu thông qua hình ảnh Hình ảnh là một dang đữ liệu
đóng vai trò quan trọng trong việc trao đổi, xử lý, lưu giữ thông tin Có nhiều phươngpháp, nhiều công cụ, nhiều phần mềm xử lý ảnh đã ra đời Tăng cường chất lượng ảnh, mà
công đoạn đầu tiên là một bước tiền xử lý nhằm xác định ảnh, khắc phục những khiếm
khuyết do bước thu nhận ảnh không tốt là việc làm quan trọng Có nhiều phương pháp choviệc nâng cao chất lượng ảnh nói chung và tiền xử lý nói riêng Trong luận văn này em chỉ
mô tả một vài phương pháp tiền xử lý hình ảnh (chú trọng đến ảnh nhị phân, bởi ảnh của cácbản vẽ kỹ thuật và sách scan thường chi là ảnh 2 màu: den, trang) nhằm cải thiện chất lượnghình anh bằng các thao tác Hình thái học (Morphology) dé ứng dụng vào chương trình nang
cao chat lượng ảnh Scan
Các thao tác Hình thái học nói chung, đặc biệt là Hình thái học số được sử dụng chủ
yếu vào việc cải thiện ảnh bằng cách làm rõ (tái hiện) những nét đặc trưng của các hình
dạng, do vậy mà có thể tính toán được hay nhận biết được chúng một cách dễ dàng Việc sửdụng các thao tác hình thái và ứng dụng của chúng, đặc biệt là ứng dụng nâng cao chấtlượng hình ảnh cho bước tiền xử lý, trước khi thực hiện những bước kế tiếp cho công việc
xử lý anh.
Chính vì vậy em đã lựa chọn luận văn “ Nghiên cứu phép toán hình thái và ứng
dụng nâng cao chất lượng ảnh nhị phân”
Mục tiêu của luận văn là tìm hiểu nghiên cứu một sỐ kỹ thuật nâng cao chất lượng
ảnh nhị phân đặc biệt là phép toán hình thái học vào xử lý các đối tượng trong hình ảnh vàxây dựng chương trình ứng dụng thực tế
Báo cáo luận văn được chia làm 3 chương:
Chương I Tổng quan về phương pháp nâng cao chất lượng ảnh:
Chương II Ứng dụng phép toán hình thái trong nâng cao chất lượng ảnh nhị
phân
Chương III Kiém nghiệm và đánh giá
Trang 4CHƯƠNG 1 TONG QUAN VE PHƯƠNG PHÁP NÂNG CAO
CHAT LƯỢNG ANH
Trong ngành khoa hoc máy tính, xử ly ảnh là một dang của xử lý tín hiệu cho đầuvào là một ảnh hoặc các frame của phim ảnh Đầu ra có thé là một hình ảnh, hoặc tập hợpcác ký tự hoặc các tham số liên quan tới hình ảnh Thường thì kỹ thuật xử lý ảnh có liênquan tới xử lý tín hiệu hai chiều va được áp dụng bằng một chuẩn riêng về kỹ thuật xử lýảnh cho nó Các khái niệm cơ bản dé xử lý tín hiệu như, khái niệm về tích chập, các biến đổiFourier, biến đổi Laplace, các bộ lọc hữu hạn Ngoài ra còn cần tới các công cụ toán họcnhư đại số tuyến tính, xác xuất, thống kê Và một số kiến thức cần thiết như trí tuệ nhân tao,mạng noron nhân tạo cũng được đề cập trong quá trình phân tích và nhận dạng ảnh
1.1 Giới thiệu chung về xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan
trọng nhất Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồhoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống Xử lý ảnh và đồ
hoạ đóng một vai trò quan trọng trong tương tác người máy
Xử lý ảnh bao gồm các phương pháp va kỹ thuật dé biến đổi, dé truyền tải hoặc mãhóa các ảnh tự nhiên Mục đích của xử lý ảnh gồm:
Thứ nhất, biến đổi ảnh và làm đẹp ảnh.
Thứ hai, tự động nhận dang ảnh hay đoán nhận ảnh và đánh giá các nội dung của ảnh.
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc
tả nó Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đốitượng Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dang theo tham số).
- Mô tả theo cau trúc(nhận dang theo cấu trúc)
Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thànhnhững phần có nghĩa để phân biệt đối tượng này với đối tượng khác Dựa vào đó ta có thể
mô tả câu trúc của hình ảnh ban đâu.
Trang 5Có thé liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của mộtđối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh Kỹ thuật này được sử dụng nhiều trong
y học (xử lý tế bào, nhiễm sắc thể)
Trong thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối
tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu).
Nhận dạng chữ In hoặc đánh máy trong văn bản phục vụ cho việc tự động hoá quá trình đọc
tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính, nhận dạng chữ viếttay (với mức độ ràng buộc khác nhau về cách viết, kiêu chữ, )
Các quá trình của xử lý ảnh:
Các quá trình của xử lý ảnh [3] được tiến hành theo sơ đồ sau:
Thu Số hoá Phân Nhận
A" nhan anh tich anh dang
Sensor
Hệ
quyết định
Hình 1.1: Các giai đoạn chính trong xử lý ảnh
Trước hết là quá trình thu nhận ảnh Ảnh có thé thu nhận qua camera, vệ tinh, may
quét
Tiếp theo là quá trình số hóa (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu
rời rac (lấy mẫu) va số hóa bằng lượng hóa, trước khi chuyên sang giai đoạn xử lý, phân tích
hay lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ Trước hết là côngviệc tăng cường hình ảnh (Image Enhancement) dé nâng cao chất lượng hình anh Do nhữngnguyên nhân khác nhau: có thể do thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh cóthé bị suy biến Do vậy cần phải tăng cường và khôi phục (Image Restoration) lại ảnh délàm nỗi bật một số đặc tính chính của anh, hay làm cho ảnh gần giống với trạng thái gốc -trạng thái trước khi ảnh bị biến dạng Giai đoạn tiếp theo là phát hiện các đặc tính như biên
Trang 6(Edge Detection), phân vùng ảnh (Image Segmentation), trích chọn các đặc trưng (Feature
Extraction),v.v
Cuối cùng, tuỳ theo mục dich của ứng dụng, sé là giai đoạn nhận dang, phan lớp hay
các quyết định khác Các giai đoạn chính của quá trình xử lý ảnh có thé mô tả ở hình 1.1
1.2 Một số van đề trong xử lý ảnh
1.2.1 Các khái niệm cơ bản
Phần tử ảnh (Pixel - Picture Element) Anh trong thuc tế là một ảnh liên tục về khônggian và về giá trị độ sáng
Đề có thể xử lý bằng máy tính cần thiết phải tiến hành số hóa ảnh Trong quá trình số
hóa người ta biến đổi từ tín hiệu liên tục sang tín hiệu rời rac thông qua quá trình lay mau(rời rạc hóa về không gian) và lượng hóa thành phần về giá trị mà về nguyên tắc bằng mắtthường không phân biệt được hai điểm kề nhau Trong quá trình này người ta sử dụng kháiniệm Picture element mà ta quen gọi hay viết là Pixel Vậy 1 anh là một tập hợp các pixel
Mức xám (Gray level) là kết quả sự mã hóa tương ứng với một cường độ sáng củamỗi điểm ảnh với một giá trị số - kết quả của quá trình lượng hóa Cách mã hóa kinh điển
thường dùng 16, 32 hay 64 mức Mã hóa 256 mức là phô dụng nhất do lý do kĩ thuật Vì 2°
= 256 (0,1, 255), nên với 256 mức, mỗi pixel sẽ được mã hóa bởi 8 bit.
Độ phân giải (Resolation) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh sốđược hiền thị Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng dé mô tả ảnh gần
với ảnh thật.
Ảnh nhị phân là ảnh chi có hai mức xám 0 và 1
Ảnh màu là ảnh số trong đó cường độ điểm ảnh là sự tổng hợp từ các màu tùy theotừng loại mà có cách biéu diễn khác nhau
Ảnh đa mức xám là ảnh có nhiều hơn hai mức xám
1.2.2 Biểu diễn ảnh
Trong biểu diễn ảnh, người ta thường dùng các phan tử đặc trưng của ảnh là pixel.Nhìn chung có thể một ham hai biến chứa các thông tin như biéu diễn của một ảnh Các môhình biéu dién cho ta một mô tả logic hay định lượng các tính chất của hàm này Trong biéu
diễn ảnh cần chú ý đến tính trung thực hoặc các tiêu chuẩn “thông minh” dé đo chất lượng
Trang 7ảnh hoặc tính hiệu quả của các kĩ thuật xử lý Một số mô hình thường được dùng trong biểudiễn ảnh: mô hình bài toán, mô hình thống kê Trong mô hình bài toán, ảnh hai chiều đượcbiểu diễn nhờ các hàm hai biến trực giao gọi là các hàm cơ sở Còn mô hình thống kê, mộtảnh được coi như một phần tử của một tập hợp đặc trưng bởi các đại lượng như: kỳ vọng
toán học, hiệp biến, phương sai, moment.
1.2.3 Biến doi ảnh (Image Transform)
Thuật ngữ biến đổi ảnh thường dùng dé nói tới một lớp các ma trận don vị va các kĩthuật dùng dé biến đổi ảnh Biến đổi ảnh nhằm làm giảm các nguyên nhân của ảnh dé việc
xử lý hiệu quả hơn Như làm rõ hơn các thông tin mà ngời dùng quan tâm nhưng người
dùng phải chấp nhận mắt đi một số thông tin cần thiết
1.2.4 Phân tích ảnh
Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của | anh để đưa ra
một mô tả đầy đủ về ảnh Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ
Trước hết là công việc tăng cường ảnh để nâng cao chất lượng ảnh, giai đoạn tiếp theo là
phát hiện các đặc tính như phát hiện biên, phân vùng ảnh, trích chọn các đặc tinh v.v
1.2.4.1 Tăng cường ảnh — khôi phục anh
1.2.4.2 Biên
1.2.4.3 Phan vùng
1.2.5 Nhận dạng anh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc
tả nó Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đốitượng Có hai kiểu mô tả đối tượng: Mô tả tham số (nhận dạng theo tham số) Mô tả theocấu trúc (nhận dạng theo cấu trúc) Trên thực tế người ta đã áp dụng kỹ thuật nhận dạng kháthành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ viết
1.2.6 Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi trên mang màlượng thông tin để biểu diễn cho một ảnh là rất lớn Do đó làm giảm lượng thông tin haynén dit liệu là một nhu cau cần thiết Nén dé liệu là quá trình làm giảm lượng thông tin “ du
Trang 8thừa” trong dit liệu gốc và do vậy lượng thông tin thu được sau khi nén thường nhỏ hon dữliệu gốc rất nhiều.
1.3 Các kỹ thuật nâng cao chất lượng ảnh
1.3.1 Các kỹ thuật không phụ thuộc không gian
1.3.1.1 Giới thiệu
Các phép toán không phụ thuộc không gian là các phép toán không phục thuộc vi trí
của điểm ảnh
Ví dụ: Phép tăng giảm độ sáng , phép thống kê tần suất, biến đổi tần suất v.v
Một trong những khái niệm quan trọng trong xử lý ảnh là biểu đồ tần suất
Trang 91.3.1.5 Cân bằng histogram
1.3.1.6 Kỹ thuật tách ngưỡng tự động
1.3.1.7 Biến đôi cấp xám tong thé
1.3.2 Các kỹ thuật phụ thuộc không gian
1.3.2.1 Phép cuộn và mẫu
1.3.2.2 Một số mẫu thông dụng
1.3.2.3 Lọc trung vi
* Định nghĩa 2.1 (Trung vi): Cho dãy x1; x2 ; xn đơn điệu tăng (giảm) Khi đó
trung vị của dãy ký hiệu là Med({xn}), được định nghĩa:
®Ir—x, > min tại Med({x, })
1.3.2.4 Loc trung binh
* Dinh nghia 2.2 (Trung binh): Cho day x1, x2 , xn khi do trung binh cua day ky hiệu AV({xn}) được định nghĩa:
Trang 10-1.3.3 Các phép toán hình thái.
Ý nghĩa của “Morphology” là hình thái học và cấu trúc của đối tượng, hay nó mô tảnhững phạm vi và các mối quan hệ giữa các thành phần trong một đối tượng
Phần lớn các phép toán hình thái học được định nghĩa từ hai phép toán cơ bản là
phép toán co nhị phan (Erosion) và phép toán giãn nhị phan (Dilation)
1.3.3.1 Phép giãn nhị phân (Dilation[4])
Phép giãn nhị phân của tập hợp A bởi phan tử cau trúc B là tập hợp của tat cả cácđiểm z (z là tâm điểm của phan tử cấu trúc B trên tập hợp A) sao cho phản xa của Ö, giao
với tập A tại ít nhất một điểm
Với A và B là các tập hợp trong 2’, thì phép giãn nhị phân của A theo 8 (A®B) được
định nghĩa qua công thức sau:
A98 |8) ¬aze]
1.3.3.2 Phép co nhị phân (Erosion{ 4]).
Phép co nhị phân của tập hợp A bởi phan tử cấu trúc B được kí hiệu AOB và viết
dưới dạng công thức như sau:
Với tập hop A là đối tượng trong hình anh và B là phan tử cấu trúc, (s ) là ký hiệu củaphép mở ảnh giữa tập hop A và phần tử cấu trúc B, phép mở ảnh được xác định bởi công
thức:
Ao 8=(1O BOB,
Trang 131.4 Kết luận
Chương này tìm hiểu tổng quan về các phương pháp nâng cao chất lượng ảnh
bao gồm có các khái niệm ban đầu về xử lý ảnh, các kỹ thuật nâng cao chất lượng ảnh phụ
thuộc và không phụ thuộc không gian Ngoai ra nội dung chương còn trình bay các thuật
toán xử lý hình thái học cơ bản như: phép co ảnh, phép giãn ảnh, phép mở ảnh, phép đóng
ảnh Thông qua nội dung chương, người đọc bước đầu có được các kiến thức chung tronglĩnh vực xử lý ảnh, các kỹ thuật nâng cao chất lượng ảnh và một số phép toán hình thái cơ
bản.
Trang 14CHƯƠNG II UNG DỤNG PHÉP TOÁN HÌNH THÁI TRONG
NÂNG CAO CHAT LƯỢNG ANH NHI PHAN
Hình ảnh trong thực tế khi nhận được qua các thiết bi như: Photocopy, Fax, ít nhiềuđều bị nhiễu, thậm chí có thé biến dạng đến mức độ có thé khiến người nhận được hiểu sai
về mặt ý nghĩa Dé giải quyết bài toán này như: nối liền những nét đứt, nối liền chữ, làm
trơn biên ảnh các phép toán hình thái nhị phân đã ra đời, thông qua các phép toán cơ bản
như phép giãn ảnh, phép co ảnh, phép đóng ảnh, mở ảnh để giải quyết bài toán nêu trên
2.1 Khái niệm cơ bản
Phép toán cơ sở được kết hợp với một đối tượng là tiêu chuẩn của các phép toán tập
hợp như phép hợp (Union), Phép giao (InterSection), và phép bù (Complement) cộng với
phép tịnh tiến nào đó
Đối với ảnh nhị phân, phần tử cấu trúc là một ảnh có kích thước nhỏ gồm có hai giá trị 0 và
1, các giá trị bằng 0 được bỏ qua trong quá trình tính toán,
2.2 Các phép toán Logic liên quan đến ảnh nhị phân
Các phép toán logic được sử dụng trong xử lý anh là AND(A), OR(v ), và NOT(¬)
Các phép toán đó cung cấp đầy đủ các chức năng, chúng có thể được kết hợp dưới bất kỳ
dạng nào của phép toán logic.
2.3 Một số tinh chat của phép toán hình thái
Đề thuận tiện trong việc cài đặt ta có thê phân tích và đơn giản hóa các mẫu phức tạp,
dưới đây là một số tính chất cơ sở của phép toán hình thái
Trang 15a) X®(8LB)=(X ®B)L)(X OB),
b) X O(BUB')=(X OB)U(X OB’),
- Mệnh dé 3: Tính chat phân phối với phép giao
Giả sử, X là một đối tượng trong ảnh, B là phần tử cấu trúc, khi đó X sẽ bị chặn trên
và chặn dưới bởi tập close của X theo B.
2.4 Phép Biến déi trúng hoặc trượt (Hit-or-Miss)
Phép biến đổi “trúng hoặc trượt” được đưa ra bởi Serra [7] và là một công cụ cơ bản
để ứng dụng vào phát hiện hình dạng của đối tượng
2.5 Các ứng dụng cơ bản của hình thái học
Ứng dụng chủ yếu của hình thái học đối với ảnh nhị phân là phân tích các thành phần
của ảnh, chính vì nó rất có hiệu quả trong biểu diễn và mô tả hình dạng đối tượng cho nên
phần này sẽ tập trung đưa ra các thuật toán về hình thái [1] để trích đường biên, các thànhphần liên thông, đường bao lỗi, hay tìm xương làm mảnh
2.5.1 Trích biên ( Boundary Extraction)
Biên của tập hợp A phụ thuộc vào kích thước của phần tử cấu trúc Độ dày củađường viền bao quanh đối tượng phụ thuộc vào kích thước cua phần từ cau trúc Ví dụ, nếu
Trang 16Hình 2.8: Quá trình tìm biên của đối tượng trên ảnh nhị phân.
2.5.2 Làm day (Region Filling)
Làm day vùng của một đối tượng từ biên là bổ xung giá trị 1 vào toàn bộ vùng ở phía
bên trong biên của đối tượng Cho một ảnh nhị phân A, các điểm ảnh ở biên của đối tượng
trong hình anh A có giá trị là 1 và các diém ảnh khác có giá trị là 0 Ta bắt đầu quá trình làm
day bằng cách gan giá trị 1 vào điểm ảnh p ở bên trong biên của đối tượng, sau đó lặp đi lặp
lại phép giãn nhị phân giữa điểm anh với phan tử cấu tric B dưới giới hạn đặt ra bởi phép
bù của tập hợp A (A‘) Bởi vi nếu hạn chế không được đặt thì chương trình sẽ lặp đi lặp lại
phép gan nay, dẫn tới say ra hiện tượng tràn qua các cùng khác trên ảnh, thậm chí toàn bộ
ảnh.
Với Xo=p và B là phan tử cấu trúc, phép làm day vùng trong ảnh sẽ được xác định
bởi công thức:
X,=Œ/,¡@ B) OAS, Với k=1,2,3, k-] (2.20) Thuật toán sẽ dừng khi X;=X,,.¿.