Luận văn này tập trung vào tìm hiểu và nghiên cứu các phương pháp tiền xử lý hình ảnh, nhận dạng chữ từ hình ảnh. Để từ đó áp dụng vào nhận dạng các thông tin trên ảnh giấy chứng minh nhân dân. Cấu trúc Luận văn gồm 4 chương: Chương I: Tổng quan về xử lý ảnh. Trong chương này Luận văn nghiên cứu phần tổng quan của xử lý ảnh, và phạm vi ứng dụng của đề tài. Chương II: Một số thuật toán tiền xử lý ảnh. Chương này tập trung trình bày một số thuật toán cơ bản trong phân đoạn tiền xử lý ảnh. Chương III: Thuật toán phân tích chứng minh nhân dân. Trong chương này trình bày việc áp dụng các thuật toán tiền xử lý ảnh vào ảnh chứng minh nhân dân. Phân tích và nhận dạng thông tin trên ảnh chứng minh nhân dân. Chương IV: Cài đặt chương trình và đánh giá. Trình bày quy trình cài đặt phần mềm và kết quả thu được.
Trang 1Ứng dụng một số kĩ thuật xử lý ảnh trong phân tích
chứng minh thư nhân dân
Trang 2Nhận dạng và xử lý ảnh là một trong những lĩnh vực có nhiều ứng dụngtrong thực tiễn như: hệ thống thông tin địa lý, y học, quân sự… Hiện nay, hầu hếtcác thông tin cá nhân, bằng cấp, giấy chứng nhận đều được lưu ở dạng thẻ theo mộtmẫu nhất định Để giúp cho quá trình thu nhận dữ liệu từ những thẻ này được nhanhchóng và chính xác, đòi hỏi phải có một chương trình có thể nhận dạng và xử lýhình ảnh một cách chính xác.
Nhận thấy sự cấp thiết của các cơ quan nhà nước trong công tác quản lýthông tin của người dân được ghi trên giấy chứng minh nhân dân Với mong muốnđóng góp một phần vào công tác quản lý này, chúng em đã chọn đề tài “Ứng dụngmột số kĩ thuật xử lý ảnh trong phân tích chứng minh thư nhân dân” để thực hiện
Luận văn này tập trung vào tìm hiểu và nghiên cứu các phương pháp tiền
xử lý hình ảnh, nhận dạng chữ từ hình ảnh Để từ đó áp dụng vào nhận dạng cácthông tin trên ảnh giấy chứng minh nhân dân
Cấu trúc Luận văn gồm 4 chương:
Chương I: Tổng quan về xử lý ảnh Trong chương này Luận văn nghiên cứuphần tổng quan của xử lý ảnh, và phạm vi ứng dụng của đề tài
Chương II: Một số thuật toán tiền xử lý ảnh Chương này tập trung trìnhbày một số thuật toán cơ bản trong phân đoạn tiền xử lý ảnh
Chương III: Thuật toán phân tích chứng minh nhân dân Trong chương nàytrình bày việc áp dụng các thuật toán tiền xử lý ảnh vào ảnh chứng minhnhân dân Phân tích và nhận dạng thông tin trên ảnh chứng minh nhân dân.Chương IV: Cài đặt chương trình và đánh giá Trình bày quy trình cài đặtphần mềm và kết quả thu được
Trang 3TÓM TẮT 2
DANH MỤC CÁC TỪ VIẾT TẮT 5
DANH MỤC CÁC BẢNG 6
DANH MỤC CÁC SƠ ĐỒ, HÌNH ẢNH 7
MỞ ĐẦU 10
CHƯƠNG I TỔNG QUAN VỀ XỬ LÝ ẢNH 12
1.1 Xử lý ảnh là gì? 12
1.2 Hệ thống xử lý ảnh 12
1.3 Một số khái niệm liên quan 14
1.3.1 Phần tử ảnh 14
1.3.2 Mức xám 14
1.3.3 Ảnh 14
1.4 Một số định dạng ảnh hiện nay 17
1.4.1 Ảnh BMP (Bitmap) 17
1.4.2 Ảnh JPEG (Joint Photographic Experts Group) 17
1.4.3 Ảnh GIF (Graphics Interchange Format) 17
1.4.4 Ảnh WMF (Windows Metafiles) 17
CHƯƠNG II MỘT SỐ THUẬT TOÁN TIỀN XỬ LÝ ẢNH 18
2.1 Nhị phân ảnh 18
Trang 42.2.2 2.2.4 Nhận xét 31
2.3 Các toán tử hình thái (Morphological operations) 31
2.4 Kết chương 35
CHƯƠNG III THUẬT TOÁN PHÂN TÍCH CHỨNG MINH NHÂN DÂN 36
3.1 Giới thiệu bài toán 36
3.2 Phân tích và tách các trường thông tin 36
3.3 Tách các trường thông tin ở mặt trước 38
3.4 Tách các trường thông tin ở mặt sau 40
3.5 Nhận diện kí tự trên ảnh chứng minh nhân dân 41
CHƯƠNG IV CÀI ĐẶT CHƯƠNG TRÌNH VÀ ĐÁNH GIÁ KẾT QUẢ 44
4.1 Cài đặt chương trình 44
4.2 Kết quả thực nghiệm 47
KẾT LUẬN 50
KIẾN NGHỊ NHỮNG NGHIÊN CỨU TIẾP THEO 51
DANH MỤC TÀI LIỆU THAM KHẢO 52
PHỤ LỤC 54
Trang 5Chứng minh nhân dân CMND
Trang 6Bảng 3.1 Đặc trưng cho các trường thông tin ở
mặt trước
Trang 7Hình 1 Các giai đoạn chính trong xử lý ảnh
Hình 2 Biểu diễn ảnh nhị phân bằng mảng 2 chiều
Hình 3 Biểu diễn ảnh xám bằng mảng 2 chiều
Hình 4 Ma trận biểu diễn mức xám của thành phần RED
Hình 5 Ma trận biểu diễn mức xám của thành phần GREEN
Hình 6 Ma trận biểu diễn mức xám của thành phần BLUE
Hình 7 Minh họa phương pháp Otsu
Hình 8 Biến đổi Hough
Hình 9 Phương pháp láng giềng gần nhất
Hình 10 Phương pháp chiếu nghiêng
Hình 11 Phép giãn ảnh với phần tử cấu trúc 3x3
Hình 18 Xác định vùng thông tin mặt trước
Hình 19 Các trường thông tin cần tách ở mặt sau
Hình 20 Tách trường thông tin mặt sau dựa trên vị trí con dấu
Hình 21 Các bước xử lý các trường thông tin trong quá trình nhận dạng kí tựHình 22 Kết quả nhận dạng các trường thông tin ở mặt trước
Hình 23 Kết quả nhận dạng các trường thông tin ở mặt sau
Hình 24 Giao diện chính của phần mềm
Hình 25 Giao diện đọc mặt trước giấy CMND
Hình 26 Giao diện đọc mặt sau giấy CMND
Hình 27 Giao diện đọc cả hai mặt giấy CMND
Hình 28 Giao diện upload trực tiếp giấy CMND từ camera thiết bị
Hình 29 Kết quả đọc ảnh CMND mặt trước
Hình 30 Kết quả đọc ảnh CMND mặt sau
Trang 9MỞ ĐẦU
Ngày nay, với sự phát triển mạnh mẽ của công nghệ thông tin, nó đã đem lạinhững ứng dụng to lớn trong nhiều lĩnh vực khác nhau Công nghệ thông tin đã trởthành ngành công nghiệp mũi nhọn của nhiều nước trên thế giới Bên cạnh đó, hìnhảnh cũng là một dạng dữ liệu đóng vai trò quan trọng trong việc trao đổi, xử lý vàlưu giữ thông tin
Trong việc quản lý, thu nhận và xử lý thông tin với khối lượng ngày cànglớn, việc sử dụng phần mềm với cách nhập liệu thủ công sẽ tốn rất nhiều thời gian
và công sức, không đem lại hiệu quả mong muốn Thực tế, hiện nay mỗi công dânviệt nam đều có nhiều loại giấy tờ tùy thân (giấy phép lái xe, giấy chứng minh nhândân, thẻ bảo hiểm,…), được sử dụng trong nhiều lĩnh vực khác nhau: y tế, quản lýthông tin cá nhân ở các cơ quan nhà nước… Mặt khác, có thể nhận thấy giấy chứngminh nhân dân là loại giấy tờ quan trọng mà mọi công dân việt nam từ 16 tuổi trởlên đều có và được sử dụng thường xuyên Giấy chứng minh nhân dân giúp các cơquan nhà nước xác minh danh tính và một số vấn đề liên quan mang tính cá nhâncủa người đó Giúp các cơ quan quản lý, khai thác, điều tra tội phạm một cách dễdàng hơn Tuy nhiên, hiện nay việc thu nhận thông tin này hầu hết đều thực hiệnbằng các phương pháp thủ công dẫn tới sai sót trong quá trình nhập liệu và hiệu quảcông việc chưa cao Do đó, việc xử lý thông tin hình ảnh là rất cần thiết, giúp choviệc thu nhận thông tin được dễ dàng và nhanh chóng hơn, dữ liệu ít sai sót và manglại hiệu quả cao hơn Đó cũng là mục tiêu của đề tài phân tích và xử lý thông tinhình ảnh chứng minh nhân của chúng em
Để thực hiện và kiểm chứng đề tài này chúng em cũng gặp phải không ít khókhăn Chứng minh nhân dân chứa những thông tin cá nhân rất quan trọng và thườngđược các cơ quan, tổ chức nhà nước tập trung cất giữ rất bảo mật để tránh bị những
kẻ xấu lợi dụng để thực hiện những mục đích xấu Do đó, việc thu thập bộ dữ liệu
Trang 10chứng minh nhân dân là việc hết sức khó khăn Và chính vì thế, việc thu thập giấychứng minh chủ yếu được thông qua ảnh chụp camera từ nhiều nguồn khác nhau,dẫn đến nguồn ảnh đầu vào không được đồng nhất về kích thước, màu sắc, độ phângiải cũng như các thông số kĩ thuật khác Kết quả là bước xử lý hình ảnh đầu vàohết sức khó khăn.
Trang 11CHƯƠNG I TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1 Xử lý ảnh là gì?
- Xử lý ảnh là phương thức để thực hiện một số hoạt động lên hình ảnh, để cóđược một hình ảnh nâng cao hoặc trích xuất một số thông tin từ ảnh Quátrình xử lý ảnh được xem như là quá trình biến đổi ảnh đầu vào sang một ảnhmới với các đặc tính và kết quả mong muốn
- Xử lý ảnh có thể gồm quá trình phân tích, phân lớp các đốitượng, làm tăngchất lượng, phân đoạn và tách cạnh, gán nhãn cho vùng hay quá trìnhbiêndịch các thông tin của ảnh Kết quả đầu ra của một quá trình xử lý ảnh có thể
là một ảnh tốt hơn hoặc những ký tự liên quan trong hình
- Xử lý ảnh được áp dụng trong nhiều lĩnh vực khác nhau như: Y học, vật lý,hóa học, truy tìm tội phạm
Mục đích:
Biến đổi ảnh nhằm tăng chất lượng của ảnh
Tự động nhận dạng hình ảnh
1.2 Hệ thống xử lý ảnh
Hình 1.1 Các giai đoạn chính trong xử lý ảnh
- Thu nhận ảnh: Đây là công đoạn đầu tiên mang tính quyết định đối với quátrình xử lý ảnh Ảnh đầu vào sẽ được thu nhận qua các thiết bị như camera,
Trang 12sensor, máy scanner,v.v… và sau đó các tín hiệu này sẽ được số hóa Việc lựachọn các thiết bị thu nhận ảnh sẽ phụ thuộc vào đặc tính của các đối tượngcần xử lý Các thông số quan trọng ở bước này là độ phân giải, chất lượngmàu, dung lượng bộ nhớ và tốc độ thu nhận ảnh của các thiết bị.
- Tiền xử lý: Ở bước này, ảnh sẽ được chuẩn hóa về độ tương phản, khửnhiễu,khử bóng, khử độ lệch,v.v… với mục đích làm cho chất lượng ảnh trởlên tốt hơn Quá trình này thường được thực hiện bởi các bộ lọc
- Trích chọn đặc điểm: Giai đoạn này phân tích ảnh thành những thành phần
có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn
để xác định các vùng liên thông có thể là cùng màu, cùng mức xám v.v…Mục đích của trích chọn đặc điểm là phân tích ảnh thành các vùng, hiểu đượcvai trò, chức năng của mỗi vùng cũng như mối quan hệ giữa chúng Đồngthời, qua bước này ta cũng có thể có một miêu tả tổng hợp về nhiều phần tửkhác nhau cấu tạo lên ảnh thô Vì lượng thông tin chứa trong ảnh rất lớn,trong khi đa số các ứng dụng chúng ta chỉ cần trích một vài đặc trưng nào đó,
do vậy cần có một quá trình để giảm lượng thông tin khổng lồ đó Quá trìnhnày bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu
- Đối sánh và rút ra kết luận: Đây là bước cuối cùng trong quá trình xử lý ảnh.Nhậndạng ảnh có thể được hiểu một cách đơn giản là việc gán nhãn cho cácđốitượng trong ảnh Ví dụ đối với nhận dạng chữ viết, các đối tượng trongảnh cần nhận dạng là các mẫu chữ, ta cần tách riêng các mẫu chữ đó ra vàtìm cách gán đúng các ký tự của bảng chữ cái tương ứng cho các mẫu chữthu được trong ảnh Giải thích là công đoạn gán nghĩa cho một tập các đốitượng đã được nhận biết
Chúng ta cũng có thể thấy rằng, không phải bất kỳ một ứng dụng xử lý ảnhnào cũngbắt buộc phải tuân theo tất cả các bước xử lý đã nêu ở trên, ví dụnhư các ứng dụng chỉnh sửa ảnh nghệ thuật chỉ dừng lại ở bước tiền xử lý.Một cách tổng quát thì những chức năng xử lý bao gồm cả nhận dạng và giải
Trang 13thích thường chỉ có mặt trong hệ thống phân tích ảnh tự động hoặc bán tựđộng, được dùng để rút trích ra những thông tin quan trọng từ ảnh, ví dụ nhưcác ứng dụng nhận dạng ký tự quang học, nhận dạng chữviết tay v.v…
1.3 Một số khái niệm liên quan
1.3.1 Phần tử ảnh
- Ảnh trong tự nhiên là những tín hiệu liên tục về không gian và giá trị độsáng Để có thể lưu trữ và biểu diễn ảnh bằng máy tính, con người phải tiếnhành biến đổi các tín hiệu liên tục đó thành một số hữu hạn các tín hiệu rờirạc thông qua quá trình lượng tử hóa và lấy mẫu thành phần giá trị độ sáng
- Một phần tử ảnh (Picture Element) là một giá trị biểu diễn cho mức xám haycường độ ảnh tại một vị trí sau khi đã biến đổi ảnh thành một số các tín hiệurời rạc
1.3.2 Mức xám
- Là kết quả của sự biến đổi tương ứng với giá trị độ sáng của một điểm ảnhvới một số nguyên dương Tùy thuộc vào số giá trị biểu diễn mức xám màmỗi điểm ảnh sẽ được biểu diễn trên 1, 4, 8, 24 hay 36 bit Số lượng bit biểudiễn ảnh càng lớn thì chất lượng ảnh càng cao nhưng sẽ tốn dung lượng bộnhớ nhiều hơn để lưu trữ và cần một hệ thống mạnh hơn để xử ly
1.3.3 Ảnh
- Ảnh là tập hợp hữu hạn các điểm ảnh kề nhau Ảnh thường được biểu diễnbằng một ma trận hai chiều, mỗi phần tử của ma trận tương ứng với mộtđiểm ảnh
- Ảnh nhị phân (đen trắng): là ảnh có giá trị mức xám của các điểm ảnh đượcbiểu diễn bằng 1 bit(giá trị 0 hoặc 1)
Trang 14Hình 1.2 Biểu diễn ảnh nhị phân bằng mảng 2 chiều
- Ảnh xám:Giá trị mức xám của các điểm ảnh được biểu diễn bằng 8 bit (giátrị từ 0 đến 255)
Hình 1.3 Biểu diễn ảnh xám bằng mảng 2 chiều
- Ảnh màu:Thông thường, ảnh màu được tạo nên từ 3 ảnh xám đối với cácmàu nền đỏ (RED), xanh lá cây (GREEN) và xanh lam (BLUE) Tất cả cácmàu trong tự nhiên đều có thể tổng hợp được từ 3 thành phần màu trên theocác tỷ lệ khác nhau
Trang 15Hình 1.4Ma trận biểu diễn mức xám của thành phần RED
Hình 1.5Ma trận biểu diễn mức xám của thành phần GREEN
Hình 1.6Ma trận biểu diễn mức xám của thành phần BLUE
Trang 161.4 Một số định dạng ảnh hiện nay
1.4.1 Ảnh BMP (Bitmap)
Là ảnh được mô tả bởi một ma trận các giá trị số xác định màu và bảng màu của các điểm ảnh tương ứng khi hiển thị Ưu điểm của ảnh Bitmap là tốc độ
vẽ và tốc độ xử lý nhanh Nhược điểm của nó là kích thước rất lớn
1.4.2 Ảnh JPEG (Joint Photographic Experts Group)
Đây là một định dạng ảnh được hỗ trợ bởi nhiều trình duyệt web Ảnh JPEG được phát triển để nén dung lượng và lưu trữ ảnh chụp, và được sử dụng tốt nhất cho đồ họa có nhiều màu sắc, ví dụ là ảnh được scan File ảnh JPEG là ảnh Bitmap đã được nén lại
1.4.3 Ảnh GIF (Graphics Interchange Format)
- Ảnh GIF được phát triển dành cho những ảnh có tính chất thay đổi Nó được
sử dụng tốt nhất cho đồ họa có ít màu, ví dụ như ảnh hoạt hình hoặc là các bức vẽ có nhiều đường thẳng File ảnh GIF cũng là ảnh Bitmap đã được nén lại
- Có 2 sự khác nhau cơ bản giữa ảnh GIF và ảnh JPEG:
Ảnh GIF được nén lại theo cách giữ nguyên toàn bộ dữ liệu ảnh trong khi ảnh JPEG được nén lại nhưng làm mất một số dữ liệu trong ảnh
Ảnh GIF bị giới hạn bởi số màu nhiều nhất là 256 trong khi ảnh JPEGkhông bị giới hạn số màu mà chúng sử dụng
1.4.4 Ảnh WMF (Windows Metafiles)
Là một tập hợp các lệnh GDI dùng để mô tả ảnh và nội dung ảnh Có 2 ưu điểm khi sử dụng ảnh WMF: kích thước file WMF nhỏ và ít phụ thuộc vào thiết bị hiển thị hơn ảnh Bitmap
1.5 Kết luận
Chương này đã trình bày quy trình xử lý và nhận dạng hình ảnh Đồng thời cũng giới thiệu được khái quát một số khái niệm về hình ảnh và các định dạng hình ảnh phổ biến hiện nay
Trang 17CHƯƠNG II MỘT SỐ THUẬT TOÁN TIỀN XỬ LÝ ẢNH
Dữ liệu đầu vào của các hệ thống xử lý ảnh thường là các ảnh được thu nhận
từ các thiết bị như: máy quét, máy ảnh hoặc các thiết bị thu nhận hình ảnh khác Cácảnh thô này thường có chất lượng thấp (bị nhiễu, mất nét hoặc bị lệch góc so vớiảnh gốc ) Nguyên nhân chính là do các thiết bị thu nhận không đạt yêu cầu, ánhsáng không tốt, thu nhận trong khi dịch chuyển làm ảnh bị lệch Để chuẩn bị chobước xử lý, thu thập thông tin của ảnh thu được kết quả tốt, cần phải có quá trìnhtiền xử lý để nâng cao chất lượng hình ảnh
Quá trình này bao gồm các công đoạn phục hồi ảnh và làm nổi bật ảnh:
Phục hồi ảnh: nhằm loại bỏ hay giảm các ảnh hưởng của môi trường tácđộng lên ảnh Bao gồm: Lọc ảnh, khử nhiễu, xoay ảnh
Làm nổi bật ảnh: Làm nổi bật các đặc trưng của ảnh phù hợp với mục tiêucuối cùng, giúp cho giai đoạn phía sau được hiệu quả hơn Công đoạn nàybao gồm: tùy chỉnh độ tương phản, làm trơn ảnh, xám hóa, nhị phân ảnh Trong đó các thao tác như nhị phân ảnh, căn chỉnh độ nghiêng và xóa nhiễu làcác thao tác cơ bản nhất và thường được áp dụng
2.1 Nhị phân ảnh
- Ảnh đầu vào nhận được các thiết bị thu nhận ảnh thường có thành phần phứctạp về màu sắc và kết cấu Vì thế để làm nổi bật các thành phần đặc trưngtrong ảnh thì phải chuyển về ảnh nhị phân
- Ảnh nhị phân là ảnh mà giá trị của các điểm ảnh chỉ được biểu diễn bằng haigiá trị là 0 (Đen) và 255 (Trắng) (Tương ứng với 0 và 1).Vì giá trị của điểmảnh được biểu diễn bởi 2 giá trị là 0 hoặc 1, nên một điểm ảnh được biểudiễn bằng 1 bit nên ảnh có kích thước rất nhỏ
Trang 18- Nhị phân ảnh là quá trình chuyển từ ảnh màu ban đầu hoặc ảnh đa cấp xám
về ảnh nhị phân
Thuật toán 2.1: Nhị phân ảnh
Input: Ảnh màu hoặc ảnh đa cấp xám
Output: Ảnh nhị phân
Thuật toán:
Gọi giá trị cường độ sáng tại một điểm ảnh là I(x, y)
INP(x, y) là cường độ sáng của một điểm ảnh trên ảnh nhị phân
(Với 0 < x < image.Width và 0 < y < image.Height)
Để biến đổi một ảnh thành ảnh nhị phân, ta so sánh giá trị cường độ sáng
với một ngưỡng nhị phân T.
Nếu I(x,y) > T thì INP(x, y) = 0 (0).
Nếu I(x,y) > T thì INP(x, y) = 255 (1).
Trang 191 0 1
Kỹ thuật này làm cho tính chất màu liên tục của ảnh bị gián đoạn nhưng cóhiệu quả trong việc thể hiện các loại ảnh có đường nét như văn bản, vân tay…
Ta có thể chọn giá trị T từ 0 đến 255, nhưng thông thường nhiều người hay
chọn một giá trị đó là 128 tức là giá trị trung bình của max(255) và min(0) củacường độ sáng của điểm ảnh
Có thể dễ dàng nhận thấy với mỗi ngưỡng T thì sẽ có một ảnh nhị phân khác
nhau (Khác nhau ở đây là cường độ sáng của các tấm ảnh nhị phân với mỗi giá
Có rất nhiều phương pháp để xác định ngưỡng phân tách T Ngưỡng T có thểđược xác định cho toàn bộ ảnh (ngưỡng tổng quát) hay được xác định cho mỗi điểmảnh cụ thể (ngưỡng cục bộ) Trong phần tiếp theo sẽ giới thiệu hai phương pháp phổbiến nhất để xác định ngưỡng T
Trang 20Input: Giá trị mức xám của các điểm ảnh g(x, y)
Output: Ngưỡng nhị phân cho mỗi điểm ảnh T(x, y)
(2.1.2)
(2.1.3)
k là tham số dùng để xác định đường biên của đối tượng chiếm bao nhiêu phầntrong đối tượng trả về Kích thước của cửa sổ phải đủ nhỏ để giữ lại các chitiết vàcũng phải đủ lớn để khử các điểm nhiễu Theo [1] thì tham số k = -0.2, kíchthướccủa sổ w =15
Cơ bản dựa trên phương pháp của Niblack, Sauvola đưa ra công thức xácđịnh ngưỡng như sau [2]:
(2.2)Trong đó: R là giá trị lớn nhất của độ lệch chuẩn (với ảnh đa cấp xám: R
=128), k là tham số nằm trong khoảng [0.2, 0.5], m(x, y) và σ(x, y) là giá trị đáp
Trang 21ứng các mức ngưỡng khác nhau tùy theo các điểm lân cận Với một vài vùng ảnh cóđộtương phản cao thì σ(x, y) ≈ R, khi đó T(x, y) ≈ m(x, y) Kết quả này giống nhưphương pháp Niblack Trong trường hợp T(x, y) nhỏ hơn giá trị trung bình thì sẽxóa
đi một vài vùng tối của nền Tham số k dùng để điểu chỉnh giá trị ngưỡng sovới giátrị trung bình m(x, y) (lớn hơn hay nhỏ hơn một tỷ lệ k)
Như vậy ngưỡng của mỗi điểm ảnh được xác định dựa trên việc đánh giá giátrị của các điểm ảnh lân cận với nó, do đó rất thích hợp cho những ảnh có độ sángthay đổi (ví dụ như ảnh chụp từ camera) Nhưng thời gian tính toán là rất chậm,tùythuộc vào kích thước của cửa sổ
Phương pháp Otsu
Đây là phương pháp xác định ngưỡng cho toàn bộ ảnh Phương pháp này sẽtìm một ngưỡng để phân chia các điểm ảnh vào hai lớp tiền cảnh (đối tượng) vànền Giá trị ngưỡng được xác định sao cho “khoảng cách” giữa các điểm ảnh trongmỗi lớp là nhỏ nhất, điều này tương đương với khoảng giữa hai lớp là lớn nhất Việcphân chia này dựa trên các giá trị trong histogram của ảnh Các bước để xác địnhngưỡng TOtsu của ảnh được tiến hành như sau:
Thuật toán2.3.Phương pháp phân ngưỡng Otsu
Input:Ảnh đa cấp xám
Output: Ngưỡng nhị phân cho toàn bộ ảnh
Bước 1: Xác định T1 Giá trị cho T1 ban đầu nên chọn là (0+255) / 2 = 128.
Bước 2: Phân loại thành 2 nhóm điểm ảnh
Loại 1 (Type1): chứa tất cả các điểm ảnh có giá trị cường độ sáng
(Intensity) <= T
Loại 2 (Type2): chứa tất cả các điểm ảnh có giá trị cường độ sáng
(Intensity) > T
Trang 22Bước 3: Tính giá trị cường độ sáng trung bình (iAverage) cho Type1 (iAverage1) và
Nếu giá trị chênh lệch của T1 và T2 > Delta thì quay lại Bước 1.
Hình 2.1 Minh họa phương pháp Otsu (Nguồn: http://www.stdio.vn)
Nhận xét: Nhị phân ảnh là một thao tác cơ bản để phân tách giữa nền và đối tượng.
Trong đó việc xác định ngưỡng nhị phân là thao tác quan trọng và khó khăn nhất
Có thể xác định ngưỡng cho toàn bộ ảnh (phương pháp Otsu) hay xác định ngưỡngcho từng điểm ảnh riêng biệt (phương pháp Niblack) tùy vào yêu cầu của bài toán
và tích chất ảnh đầu vào
Trang 23So sánh các phương pháp nhị phân ảnh đối với có độ sáng thay đổi
a Ảnhgốc
Trang 24b Phương pháp Niblack
c Phương pháp Otsu (ngưỡng 148)
So sánh các phương pháp nhị phân ảnh đối với ảnh Chứng minh nhân dân
a.ảnh gốc
Trang 25b.Phương pháp Niblack
c.Phương pháp Otsu2.2 Căn chỉnh độ nghiêng
Đối với những chương trình nhận dạng, có ảnh đầu vào là những trang tàiliệu dạng văn bản thì các ảnh thu nhận được thường bị lệch so với ảnh gốc một gócbất kỳ Nguyên nhân là do trong quá trình thu nhận: ảnh gốc bị đặt lệch, thiết bị ghinhận hình ảnh đặt không đúng vị trí hay thu nhận ảnh bị xê dịch…, điều này làkhông thể tránh khỏi Do đó, để cho các bước xử lý tiếp theo (phân tích và nhậndạng) được chính xác cần phải có thao tác hiệu chỉnh độ nghiêng của ảnh thu nhậnđược Các bước hiệu chỉnh độ nghiêng của ảnh được mô tả trong Thuật toán 2.4.Thuật toán 2.4 Hiệu chỉnh độ nghiêng của ảnh tài liệu
Input: Ảnh (nhị phân) bị nghiêng
Output: Ảnh đã chỉnh độ nghiêng
Trang 261 Xác định góc nghiêng α
2 Xoay ảnh với góc nghiêng α
Trong đó, xác định góc nghiêng là thao tác quan trọng nhất và khó khăn nhất
Có rất nhiều phương pháp khác nhau để xác định góc nghiêng: có thể trực tiếp dựavào các thống kê, đánh giá góc nghiêng của các đối tượng trong ảnh hay phân tích,đánh giá trên ảnh đã được biến đổi Trong đó có 3 phương pháp thường được sửdụng: phương pháp dựa trên biến đổi Hough, phương pháp láng giềng gần nhất(nearest neighbours) và phương pháp sử dụng chiếu nghiêng (project profile) Cácphương pháp này sẽ được trình bày ở các phần tiếp theo
Sau khi xác định được góc nghiêng của ảnh sẽ thực hiện thao tác xoay ảnhvới gócnghiêng đã xác định được quanh một vị trí gốc (tâm xoay) Tâm xoay thường lấy làđiểm chính giữa của ảnh (w/2, h/2) Các bước để xoay ảnh được thực hiện như sau:Thuật toán 2.5 Xoay ảnh
Duyệt tất cả các điểm ảnh g(x, y) trong ảnh I
1 Xác định vị trí mới g'(x', y') trong ảnh I'
x' = x0 + (x-x0).cos(α)- (y-y0).sin(α)
y' = y0 + (x-x0).sin(α) + (y-y0).cos(α)
2 Chuyển giá trị điểm ảnh: g'(x', y') = g(x, y)
Trang 272.2.1 Phương pháp dựa trên biến đổi Hough
Biến đổi Hough là phép biến đổi điểm ảnh từ hệ tọa độ đề các Oxy sang hệ tọađộcực ρ-θ Thay vì biểu diễn một tập các điểm (xi, yi) (thuộc đường thẳng) trongmặtphẳng x-y thì ta có thể biểu diễn bằng một cặp (ρ, θ) trong mặt phẳng ρ-θ Côngthứccủa phép chuyển đổi là:
x.cosθ + y.sinθ = ρ (2.2.1)Trong đó: x và y được thay thế bởi xi và yi, θ là góc giữa vector khoảng cách(tính từgốc tọa độ đến điểm gần nhất thuộc đường thẳng) và trục x, ρ là khoảngcách từ gốctọa độ tới đường thẳng (Hình 2 4)
Hình 2 2 Biến đổi Hough
Như vậy, biến đổi Hough rất hữu ích cho việc dò tìm đường thẳng trong ảnhvìthế rất thích hợp cho việc xác định góc nghiêng của ảnh có chứa các thành phầnlàcác dòng văn bản Việc xác định góc nghiêng của ảnh dựa vào biến đổi Houghgồmhai bước chính:
Thực hiện phép biến đổi Hough
Tính toán luỹ tích để tìm góc nghiêng
Thuật toán 2.6 thể hiện một cách xác định góc nghiêng dựa vào biến đổi Hough
Trang 28Trong đó bước 1 và bước 2 là thực hiện phép biến đổi Hough, bước 3 và bước 4thểhiện một cách thống kê để tìm góc nghiêng.
Thuật toán 2.6 Xác định góc nghiêng dựa vào biến đổi Hough
Input: Ảnh (nhị phân) bị nghiêng I
Output: Góc nghiêng α
1 Khởi tạo mảng: h[ρi][θi] = 0(Đếm số lượng điểm thuộc đường thẳng)
2 Duyệt tất cả các điểm ảnh:
Duyệt tất cả các góc có thể θi
Tính: ρi = x.cosθi + y.sinθi
Tăng h[ρi][θi] lên 1
3 Tìm k phần tử trong mảng h[ρi][θi] có giá trị lớn nhất
(Tìm k đường thẳng trong ảnh)
4 α là trị số trung bình của các góc trong k phân tử trên
(Tính góc nghiêng trung bình của k đường thẳng)
Biến đổi Hough sử dụng rất nhiều tính toán do phải thao tác trên từng điểmảnhriêng lẻ Người ta đã cải tiến để tăng tốc độ thực hiện bằng cách thực hiện tínhtoántrên chùm điểm ảnh Những chùm điểm ảnh này là các dải liên tục các điểmđen liêntiếp nhau theo chiều ngang hoặc chiều dọc Mỗi chùm được mã hóa bởi độdài và vịtrí kết thúc của nó Với cải tiến này thì thuật toán này thích hợp vớicác góc nghiêng
~ và cho độ chính xác rất cao
Tuy cải tiến này làm tăng tốc độthuật toán nhưng vẫn rất chậm so với các phươngpháp khác Hơn nữa, trong trườnghợp văn bản là thưa, thuật toán này tỏ ra khônghiệu quả
2.2.2 Phương pháp láng giềng gần nhất (nearest neighbors)