Một trong những vấn đề khó khăn của hệ thống nhận dạng chữ Việt là chữ bị đứt nét. Phần này đề cập đến việc ứng dụng phép toán hình thái trong việc khôi phục chữ bị đứt.
Ta có một số nhận xét sau:
- Phần lớn các văn bản photocopy đều có các nét chữ bị đứt. - Các nét bị đứt đó tập trung chủ yếu vào các chỗ mảnh.
- Các nét đứt thường có khoảng cách nhỏ hơn khoảng cách chân các chữ. - Các nét bị đứt thường nằm ở trên hoặc ở dưới của chữ cái, trừ 1 số chữ như g, k, t và một số chữ khác.
- Những phần đầu của nét chữ bị đứt thường cong và nhô ra ngoài của thân chữ.
* Các yêu cầu
- Tùy theo từng văn bản copy mà độ đứt nét là khác nhau và khoảng cách bị đứt là khác nhau nên để cho độ chính xác gần với mong muốn hơn ta nên chọn khoảng cách cho phép là bao nhiêu.
- Mặt khác chỗ giáp cả hai chữ thường gần hơn hoặc xấp xỉ bằng với khoảng cách bị đứt nét, nên ta loại bỏ các phần bị nối liền giữa các chữ cái với nhau.
Chương trình thử nghiệm với ảnh đầu vào là một chữ cái bị đứt nét. Phương pháp nối ảnh chữ đứt nét bằng phép toán hình thái được thực hiện qua hai bước:
- Bước 1: Thực hiện giãn ảnh k lần, cho đến khi nét đứt được nối. - Bước 2: Thực hiện co ảnh k lần
CHƯƠNG 3: CÀI ĐẶT THỬ NGHIỆM CHƯƠNG TRÌNH 3.1. Giới thiệu
Trên cơ sở nghiên cứu lý thuyết về các phép toán hình thái học, các kỹ thuật cải thiện chất lượng ảnh nhị phân dựa trên các phép toán hình thái học. Chương trình xử lý ảnh nhị phân được cài đặt thử nghiệm như sau:
Bước 1: Chọn ảnh nhị phân cần xử lý có định dạng JPG hoặc BMP,
hiển thị ảnh ban đầu (ảnh gốc) trên giao diện.
Bước 2: Chọn phép toán xử lý ảnh gồm:
- Các phép toán hình thái học như phép co, phép giãn, phép mở, phép đóng. - Các phương pháp tìm biên ảnh: Gradient, Laplace
- Các kỹ thuật cải thiện chất lượng ảnh bằng phép toán hình thái học như: tách biên, làm mảnh, nối chữ nét đứt.
Kết quả xử lý được hiển thị trên giao diện chương trình.
Bước 3: Lưu ảnh kết quả với định dạng JPG hoặc BMP.
Chương trình được cài đặt trên môi trường phát triển Visual Studio 2005, ngôn ngữ C#. Giao diện chương trình như sau:
3.2. Các chức năng của chương trình
Chương trình thử nghiệm các phép toán hình thái: phép giãn, phép co, phép đóng và phép mở, với phần tử cấu trúc được sử dụng là hình vuông hoặc hình chéo có kích thước 3x3.
Một số kết quả đạt được:
Hình 3.2. Phép co với phần tử cấu trúc hình vuông 1 1 1 1 1 1 1 1 1 Cấu trúc hình vuông 0 1 0 1 1 1 0 1 0 Cấu trúc hình chéo
Hình 3.3. Phép giãn với phần tử cấu trúc hình vuông
Phương pháp phát hiện biên Gradient sử dụng toán tử Sobel có kích thước 3x3 như sau:
Phương pháp phát hiện biên Laplace sử dụng toán tử có kích thước 3x3 như sau: -1 -1 -1 -1 8 -1 -1 -1 -1 -1 0 1 -2 0 2 -1 0 1 Hướng ngang (x) 1 2 1 0 0 0 -1 -2 -1 Hướng dọc (y)
Phương pháp phát hiện biên Laplace tốt hơn so với phương pháp Gradient, cho đường biên mảnh. Tuy nhiên phương pháp Laplace rất nhạy với nhiễu nên đường biên thu được thường kém ổn định.
Hình 3.4. Tìm biên theo phương pháp Gradient
Trích lọc biên ảnh nhị phân: Sử dụng công thức (0.33) với phần tử cấu
trúc B có kích thước 3x3, phần tử cấu trúc hình vuông hoặc hình chéo. Phương pháp này cho kết quả biên ảnh trơn và sắc nét hơn phương pháp Gradient hay Laplace.
Làm mảnh ảnh đối tượng: Sử dụng công thức (0.36) với 8 phần tử cấu
trúc có kích thước 3x3.
Nối chữ nét đứt: Chương trình thử nghiệm với ảnh đầu vào là một chữ
cái bị đứt nét. Phương pháp nối ảnh chữ đứt nét bằng phép toán hình thái được thực hiện qua hai bước:
- Bước 1: Thực hiện giãn ảnh k lần, cho đến khi nét đứt được nối. - Bước 2: Thực hiện co ảnh k lần
Trong chương trình thử nghiệm, tham số k được truyền vào.
KẾT LUẬN 1. Kết luận
Cải thiện chất lượng ảnh nhị phân bằng phép toán hình thái là lĩnh vực vô cùng quan trọng trong xử lý ảnh. Nó đã, đang và sẽ còn phát triển rất mạnh không chỉ trên thế giới mà còn cả ở Việt Nam bởi những ứng dụng mà nó đem lại là vô cùng to lớn. Sau một thời gian thực hiện đề tài với sự nỗ lực, cố gắng của bản thân cùng với sự hướng dẫn nhiệt tình của thầy giáo PGS.TS Ngô Quốc Tạo, em đã thu được một số kết quả chính như sau:
- Trình bày tổng quan về cải thiện chất lượng ảnh nhị phân.
- Tìm hiểu hệ thống các khái niệm cơ bản của phép toán hình thái dưới góc độ xử lý ảnh; các khái niệm, các tính chất và ứng dụng cơ bản trong xử lý và biểu diễn hình dạng đối tượng. Đồng thời qua đó giải thích và minh họa cụ thể và đưa ra mối liên hệ giữa các phép toán đó với nhau.
- Thực nghiệm các phép toán, thuật toán qua chương trình xử lý.
Trong thời gian nghiên cứu đã đạt được những kết quả còn giới hạn. Tuy nhiên luận văn đã đạt được được yêu cầu đề ra là tìm hiểu một số phương pháp cải thiện chất lượng ảnh nhị phân để tạo ra hướng tiếp cấn phép toán Hình thái học vào ứng dụng thực tế.
2. Hướng phát triển của đề tài
Các phép toán giãn nhị phân, co nhị phân, phép mở ảnh, phép đóng ảnh, là các phép toán cơ sở trong phép toán hình thái, các kỹ thuật trích biên, làm mảnh, nối chữ nét đứt đều được xây dựng từ các phép toán hình thái cơ bản. Các phép toán đó là điều kiện, cũng như tiền đề để tìm hiểu nghiên cứu các thuật toán khác có tính ứng dụng cao trong xử lý ảnh nói riêng và trong thực tế đời sống nói chung.
TÀI LIỆU THAM KHẢO
[1]. Đỗ Năng Toàn, Phạm Việt Bình (2008), Giáo trình môn học xử lý ảnh,
trường Đại học Thái Nguyên, khoa CNTT - 2008.
[2]. Đỗ Năng Toàn, Ngô Quốc Tạo (1998), Kết hợp các phép toán hình thái
học và làm mảnh để nâng cao chất lượng ảnh đường nét, tạp chí Tin học và
Điều khiển học, tập 14, Số 3, 23-29.
[3]. Đỗ Năng Toàn, Nghiên cứu một số phương pháp biểu diễn hình dạng và
ứng dụng nhận dạng ảnh, Luận án Tiến sỹ, 2001.
[4]. Lương Mạnh Bá, Nguyễn Thanh Thủy (2007), Nhập môn xử lý ảnh số,
Nhà xuất bản Khoa học kĩ thuật.
[5]. Trần Đức Toàn, Nghiên cứu một số kỹ thuật nâng cao chất luợng ảnh nhị
phân và ứng dụng.
[6]. Phạm Việt Bình (2005), “Một tiếp cận mới trong phát hiện biên dựa vào
các phép toán hình thái”. Hội thảo Quốc gia lần thứ 8 - Một số vấn đề chọn
lọc của Công nghệ thông tin và Truyền thông, Hải Phòng 25-27/08 /2005. Nxb KH&KT, Hà Nội 2006, tr 82-91.
[7]. Frank Y. Shih-Image Processing and Mathematical Morphology
Fundamentals and Applications, 2009, tr 11-24, tr 37-52.