Mục đích: Tách thành tám ảnh đơn chứa các kí tự từ ảnh vùng biển số đã thu được.
Có nhiều phương pháp để thực hiện nhiệm vụ này như: tách tĩnh, lượng tử hóa vecto, lược đồ chiếu ngang và dọc, mạng noron, trí tuệ nhân tạo, hình thái học…
Chương trình này ta dùng phương pháp hình thái học để thực hiện.
Phương pháp hình thái học: Mỗi một kí tự trên biển số sẽ là một đối
tượng có đặc điểm hình thái cụ thể như chiều rộng, chiều cao, tỉ lệ hai chiều… biến đổi tương đối ít (nếu ảnh biển số được đưa về cùng kích cỡ) mà dựa vào đó ta có thể tách ra được cụ thể từng kí tự một. Từ đó ta có thuật toán tách kí tự từ ảnh xám biển số sau đây:
Bước một: Đưa ảnh biển số về cùng một độ phân giải sau đó thực hiện xóa biên ảnh biển số.
Bước hai: Xác định ngưỡng xám để nhị phân bức ảnh biển số. Khâu này rất quan trọng, nó quyết định tình chính xác của việc nhận dạng kí tự.
Chọn ngưỡng xám theo các bước sau:
- Nâng cao tính tương phản của biển số bằng thuật toán cân bằng hóa lược đồ xám
38
- Xác định ngưỡng xám của bức ảnh mới, đây là ngưỡng xám cần tìm. - Lọc nhiễu để loại bớt các đối tượng và gán nhãn cho các đối tượng
còn lại.
- Tách ra các kí tự thông qua các đặc tính về hình thái học Ưu điểm: không phụ thuộc vào độ nghiêng, nhiễu của ảnh.
Nhược điểm: phụ thuộc vào độ chính xác của ảnh nhị phân có lấy hết được ảnh kí tự từ ảnh xám không.
3.2.3 Nhận dạng ký tự
Phương pháp phổ biến nhất để nhận dạng ký tự là dùng mạng noron, tức là huấn luyện cho máy tính để máy tính nhận dạng các kí tự. Tuy vậy, do số lượng ký tự trên biển số là không nhiều nên để đảm bảo tốc độ xử lý trong chương trình này ta chọn phương pháp hình thái học vì các ký tự đều có những đặc điểm hình thái rất riêng biệt có thể phân biệt với nhau.
Các bước thực hiện:
- Quan sát chọn ra các đặc tính phân biệt ký tự để xây dựng ma trận đặc tính.
- Xây dựng cây nhị phân tối ưu từ ma trận đặc tính và tập ký tự thu được từ bước tách ký tự.
- Kiểm tra xem số đặc tính đã đủ để nhận dạng chưa. Nếu thiếu thì phải bổ sung, thừa thì phải lược bớt đi và quay lại bước đầu tiên.
- Tiến hành nhận dạng trên cơ sở cây nhị phân tìm được.
Trong biển số xe có cả chữ cái và số nên việc phân chia nhận dạng số và chữ là cần thiết. Đối với thuật toán trên ta sử dụng các đặc tính sau để nhận dạng kí tự là số và chữ cái.
Đối với chữ số: Số điểm cắt trục dọc, ½ trục dọc, trục ngang, số lỗ tròn, vị trí lỗ tròn.
Đối với chữ cái: Số lỗ tròn mở trên hay đóng trên, mở dưới hay đóng dưới, trục dọc, trục ngang, số điểm cắt dọc ½, số điểm cắt ngang ½.
39
3.2.4 Nâng cao chất lƣợng ảnh
Để hệ thống nhận dạng được chính xác hơn với những ảnh đầu vào có chất lượng thấp thì cần phải có một phần trong hệ thống để nâng cao chất lượng ảnh, phục vụ cho quá trình nhận dạng được chính xác hơn.
Ảnh đen trắng:
Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu trắng. Người ta phân mức đen trắng đó thành L mức. Nếu sử dụng số bit B=8 bít để mã hóa
mức đen trắng (hay mức xám) thì L được xác định : L=2B (trong ví dụ của ta L=28= 256 mức)
Nếu L=2, B=1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, còn gọi là ảnh nhị phân. Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối. Nếu L lớn hơn 2 ta có ảnh đa cấp xám.
Nói cách khác, với ảnh nhị phân mỗi điểm ảnh được mã hóa trên 1 bit, còn với ảnh 256 mức, mỗi điểm ảnh được mã hóa trên 8 bit. Như vậy, với ảnh đen trắng: nếu dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám có thể biểu diễn được là 256. Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và 255 biểu diễn cho mức cường độ sáng nhất.
Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi như các phần tử logic. Ứng dụng chính của nó được dùng theo tính logic để phân biệt đối tượng ảnh với nền hay để phân biệt điểm biên với điểm khác.
Tách nhiễu và phân ngưỡng:
Tách nhiễu là trường hợp đặc biệt của dãn độ tương phản khi hệ số góc α=γ=0. Tách nhiễu được ứng dụng có hiệu quả để giảm nhiễu khi biết tín hiệu vào trên khoảng [a, b].
Phân ngưỡng là trường hợp đặc biệt của tách nhiễu khi a=b=const. Trong trường hợp này, ảnh đầu vào là ảnh nhị phân (có 2 mức). Phân ngưỡng
40
thường dùng trong kỹ thuật in ảnh 2 màu vì ảnh gần nhị phân không cho ảnh nhị phân khi quét ảnh do có nhiễu từ bộ cảm biến và biến đổi của nền. Trong bài toán nhận dạng biển số xe phân ngưỡng để ảnh đầu vào chỉ còn lại 2 màu (tối và sáng) để tiện cho việc xử lý sau này.
Trong hệ thống thì có mức phân ngưỡng mặc định, nhưng đối với một số ảnh thì mức đó là không phù hợp vì vậy cần phải thay đổi để phù hợp.
Hình 3.4 Tách nhiễu và phân ngưỡng Tăng giảm độ sáng cho ảnh:
Phép tăng giảm độ sáng cho ảnh là phép toán không phụ thuộc không gian, tức là không phụ thuộc vào vị trí điểm ảnh.
Tăng giảm độ sáng vào độ tương phản cho ảnh để làm nổi bật các chữ số lên khi ấy phân ngưỡng sẽ cho ra ảnh có chất lượng tốt hơn.
Giả sử ta có ảnh I là ma trận có kích thước m× n và số nguyên c Khi đó, kỹ thuật tăng, giảm độc sáng được thể hiện:
for (i = 0; i < m; i + +) for (j = 0; j < n; j + +) I [i, j] = I [i, j] + c -Nếu c > 0: ảnh sáng lên -Nếu c < 0: ảnh tối đi
41
Lọc nhiễu:
Cải thiện ảnh là làm cho ảnh có chất lượng tốt hơn theo ý đồ sử dụng. Thường là ảnh thu nhận có nhiễu cần phải loại bỏ nhiễu hay ảnh không sắc nét bị mờ hoặc cần làm rõ các chi tiết như đường biên ảnh.
Các toán tử không gian dùng trong kỹ thuật tăng cường ảnh được phân nhóm theo công dụng: làm trơn nhiễu, nổi biên.
Để làm trơn nhiễu hay tách nhiễu, người ta sử dụng các bộ lọc tuyến tính (lọc trung bình, thông thấp) hay lọc phi tuyến (trung vị, giả trung vị, lọc đồng hình). Từ bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua. Do đó, để lọc nhiễu người ta thường dùng lọc thông thấp (theo quan điểm tần số không gian) hay lấy tổ hợp tuyến tính để san bằng (lọc trung bình). Để làm nổi cạnh (ứng với tần số cao), người ta dùng các bộ lọc thông cao, lọc Laplace.
3.3 Xây dựng ứng dụng
3.3.1 Phát biểu bài toán
Tự động nhận dạng biển số xe là một công nghệ không còn mới nhưng khá phức tạp vì phải giải quyết các bài toán nhỏ: trích vùng biển số, cách ly ký tự, nhận dạng ký tự, nâng cao chất lượng ảnh …
Qua thời gian học hỏi và nghiên cứu em đã xây dựng chương trình ứng dụng nhận dạng biển số xe từ ảnh biển số xe là các ảnh biển số thu được từ các thiết bị thu nhận ảnh đã qua bước tiền xử lý (ảnh chỉ chứa vùng biển số).
Để xây dựng chương trình ứng dụng, em đã giải quyết bài toán cách ly ký tự, nhận dạng ký tự và nâng cao chất lượng ảnh.
Đối với bài toán tự cách ly, nhận dạng ký tự, áp dụng phương pháp hình thái học và phương pháp chuyển đổi Hough để giải quyết. Còn đối với bài toán nâng cao chất lượng ảnh, áp dụng kỹ thuật tăng giảm độ sáng cho ảnh để
42
làm nổi bật các ký tự (với những ảnh mờ) để kết quả nhận dạng được chính xác hơn.
Chương trình ứng dụng được xây dựng bằng ngôn ngữ lập trình C# với giao diện đơn giản, dễ sử dụng và bao gồm chức năng nhận dạng và nâng cao chất lượng ảnh đầu vào (sử dụng trong trường hợp chất lượng ảnh đầu vào kém, gây ảnh hưởng đến kết quả nhận dạng).
3.3.2 Giao diện chƣơng trình
Hình 4.1 Giao diện chính của chương trình
Sau khi khởi động chương trình, chúng ta chọn chức năng nạp ảnh để nạp ảnh đã được xử lý trước qua bước tiền xử lý.
43
Hình 4.2 Giao diện khi nạp ảnh
Sau khi nạp ảnh chúng ta chon chức năng nhận dạng.
Hình 4.3 Giao diện nhận dạng ảnh
Với những ảnh có chất lượng kém, kết quả nhận dạng có thể không chính xác:
44
Hình 4.4 Giao diện nhận dạng ảnh có chất lượng kém
Với những ảnh có chất lượng quá kém chúng ta chọn chức năng nâng cao ảnh để cải thiện chất lượng ảnh trước khi nhận dạng để có kết quả chính xác
45
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN
Kết luận:
Sau một thời gian nghiên cứu và tìm hiểu về hệ thống nhận dạng biển số xe, tìm hiểu thêm về các phương pháp xử lý ảnh áp dụng trong hệ thống tự động nhận dạng biển số xe, em đã xây dựng được chương trình ứng dụng nhận dạng biển số xe từ ảnh biển số. Chương trình đã thực hiện được yêu cầu đặt ra là nhận dạng được biển số xe với giao diện được việt hóa gần gũi, dễ sử dụng. Tuy nhiên chương trình vẫn còn một số hạn chế sau: tốc độ xử lý còn chậm, kết quả không chính xác với ảnh quá mờ, ảnh đầu vào là ảnh đã được xử lý qua bước tiền xử lý…
Qua thời gian thực hiện đề tài, em đã thu được nhiều kiến thức bổ ích và nhiều bài học quý báu, nhất là học hỏi được kiến thức và kinh nghiệm của các thầy cô giáo và các anh chị trong khoa Công nghệ thông tin. Nhưng do kiến thức và kinh nghiệm có hạn, thời gian còn hạn chế nên các chức năng của chương trình đơn giản, việc thiết kế và cài đặt chương trình chưa hoàn thiện như một phần mềm nhận dạng có ứng dụng cao trong thực tế, nó còn mang tính chất học hỏi, trao đổi. Vì vậy em sẽ tiếp tục nghiên cứu và tìm hiểu các thuật toán để giải quyết tiếp những nhược điểm còn lại của hệ thống, tạo nên hệ thống hoàn chỉnh, có ứng dụng cao trong thực tiễn.
Hƣớng phát triển:
Trong thời gian sắp tới em hi vọng bài toán này sẽ được phát triển ở một mức độ cao hơn với một giao diện đẹp, tiện dụng và gần gũi với người dùng hơn.
46
Ngoài ra em mong muốn sẽ nâng cao được hiệu quả chương trình nhận dạng kí tự, tách kí tự biển số trong trường hợp biển số bị nhiễu nhiều, mất thông tin do nhiễu từ điều kiện môi trường.
Với mong muốn chương trình được hoàn thiện, có ứng dụng cao trong thực tế em rất mong nhận được sự phản hồi ý kiến đóng góp từ phía quý thầy cô cùng toàn thể các bạn quan tâm.
Cuối cùng em xin được trân trọng cảm ơn sự chỉ bảo tận tình của cô giáo
Th.S Lưu Thị Bích Hương đã giúp em hoàn thành bài thực hành này! Em xin chân thành cảm ơn!
47
TÀI LIỆU THAM KHẢO
1. Sách
[1] Lương Mạnh Bá, Nguyễn Thanh Thuỷ. Nhập môn xử lý ảnh số. Nhà xuất bản . Nhà xuất bản Khoa học và Kỹ thuật, 2003.
[2] Võ Đức Khánh, Hoàng Văn Kiếm. Giáo trình xử lý ảnh số. Nhà xuất bản Đại học Quốc gia Thành phố Hồ Chi Minh.
[3] Nguyễn Kim Sách. Xử lý ảnh và Video số. Nhà xuất bản Khoa học và Kỹ thuật, 1997.
[4] Nguyễn Quốc Trung. Xử lý tín hiệu và lọc số. Nhà xuất bản Khoa học và
Kỹ thuật, 2004.
[5] Bhabatosh Chanda, Dwijesh Dutta Mạumder. Digital Imge Processing and Analysis.
[6] Thomas Braunl, S. Feyer, W. Rapt, M. Reinhardt .Parallel Image
Processing. Springer, Prentice Hall of India, 2001.
[7] Willam K. Pratt. Digital Image Processing: PIKS inside, Third Edition 2001, John Wiley& Sons, Inc.
2.Các trang web
http://vi.wikipedia.org/wiki/X%E1%BB%AD_l%C3%BD_%E1%BA%A3nh http://www.picvietnam.com/forum/forumdisplay.php?f=51