a. Công nghệ nhận dạng biển số phương tiện
Sơ đồ khối hiển thị trong Hình 1.4 minh họa quy trình hoạt động xử lý của hệ
thống ALPR điển hình [23],. Góc nhìn của máy ảnh dọc theo chiều chuyển động
của phương tiện. Bước đầu tiên trong quy trình ALPR là xác định các vùng
trong hình ảnh có biển số phương tiện. Các vùng này sẽ được gửi đến mô-đun
phân đoạn ký tự để trích xuất và cắt các phân nhóm có chứa các ký tự, logo
hợp lệ và cá ký hiệu khác của biển số phương tiện. Các hình ảnh được phân
đoạn riêng lẻ sau đó được đưa vào mô-đun nhận dạng (thường được gọi chung
là nhận dạng ký tự quang học (Optical Character Recognization - OCR) để xác
định các ký tự của biển số. Cuối cùng là mô-đun kiểm tra thông tin, đối chiếu
với cơ sở dữ liệu vi phạm.
Camera vị trí biển sốXác định Phân đoạn kí tự Nhận dạng kí tự Đối chiếuKiểm tra
Hình 1.4: Sơ đồ khối chu trình xử lý của một hệ thống ALPR điển hình
Xác định vị trí biển số:
Việc trích xác định vị trí biển số phương tiện mục đích làm giảm áp lực tính
toán đối với toàn khung hình ảnh thu được dựa theo hướng nghiên cứu: màu cơ
sở và đường viền cơ sở và học máy.
Phân đoạn ký tự:
Hình ảnh ROI của biển số phương tiện được cắt ra, mô-đun phân đoạn ký tự
phải trích xuất các hình ảnh phụ thuộc được cắt riêng lẻ cho từng ký tự trong
biển số phương tiện. Các nghiên cứu khảo sát nổi bật gồm có [47, 48, 49].
Bước đầu tiên của phân đoạn ký tự là thu được vùng sát hơn nữa chính bằng
tự là xác định các điểm cắt giữa các ký tự để đạt được các hình ảnh phụ được
phân tách thành chính xác. Minh họa về phương pháp này được thể hiện trên
hình ảnh biển số xe được tái định hình một phần trong Hình 1.5.
Hình 1.5: Phân đoạn ảnh bằng phương pháp chiếu
Nhận dạng ký tự:
Nhận dạng ký tự quang học (Optical Character Recognition - OCR) được sử
dụng để nhận dạng ký tự. Như minh họa trong Hình 1.6, quy trình tiêu chuẩn
trong việc phát triển công cụ OCR bao gồm ba bước chính sau: thu hoạch và
sắp xếp ký tự, trích trọn đặc trưng và huấn luyện phân loại. Bước tăng cường
dữ liệu tùy chọn tận dụng các ví dụ được thu thập để tăng giả tạo các hình ảnh
có sẵn cho huấn luyện.
Thu hoạch và xắp xếp Tăng dữ liệu Trích trọn đặc trưng Huấn luyện phân loại Phân đoạn kí tự Huấn luyện OCR
Hình 1.6: Hệ thống huấn luyện OCR điển hình
Tạo ra tập hợp các biển số xe, thuật toán phân đoạn chức năng sẽ cung cấp
các ký tự được phân đoạn có thể được sử dụng để huấn luyện cho OCR.
Tăng dữ liệu:
Việc thu thập các tập dữ liệu thế giới thực lớn rất tốn kém. Phương pháp
tăng dữ liệu có thể được áp dụng để bổ sung dữ liệu trong thế giới thực, do
đó mở rộng một cách nhân tạo các bộ huấn luyện. Độ biến thiên của tập huấn
luyện thường tăng theo cỡ mẫu.
Trích trọn đặc trưng:
Khi các đặc trưng đã được gom lại và xắp xếp, chúng cần được chuẩn hóa
kích thước thành kích thước giống với mẫu.
Phân loại và huấn luyện:
Một khi đã chuẩn hóa được hình ảnh ký tự và các đặc trưng được trích xuất,
một thuật toán phân loại và một kiến trúc phân loại sẽ được thực hiện. Các
thuật toán phân loại bao gồm: kNN, so khớp với mẫu, mạng nơron nhân tạo
(ANN) như tri giác đa cấp (MLP), véc-tơ máy hỗ trợ (SVM) và CNN. Các kiến
trúc phân loại bao gồm: một một (one-vs-one - OvO), một với tất (one-vs-all –
(OvA) và các tầng.