Chúng tôi đã thu thập dữ liệu chụp ảnh xe mô tô hai bánh trong các điều kiện khác nhau. Sau đây là mô tả tập ảnh và máy tính thử nghiệm:
Tập ảnh IMG_TEST: chụp ban ngày và buổi tối
Loại máy chụp Sony – DSC – W1
Độ phân giải ~ 1152 x 864 pixel Vị trí chụp ảnh thẳng đứng, chính diện
Điều kiện ánh sáng ảnh chụp khoảng 9 – 12 giờ, buổi tối.
Số lượng ảnh chụp 100
Bảng 4.1: Mô tả tập ảnh IMG_TEST
Máy tính thử nghiệm thuật toán
CPU PIV 1.5GHz
Bộ nhớ 1GB
Hệ điều hành Windows XP
Ngôn ngữ lập trình Csharp 2005
Bảng 4.2: Cấu hình máy tính chạy thử nghiệm
Bảng thống kê thử nghiệm:
Tập dữ liệu / kết quả Tập IMG_TEST
Số lượng mẫu thử nghiệm 91
Kích thước ảnh chụp 1152 x 864 Số lượng trích biển số đúng 79
Số lượng trích biển số sai 12
Tỉ lệ trích biển số đúng 87% Số lượng tách ký tự đúng 67 Số lượng tách ký tự sai 12 Tỉ lệ tách ký tự đúng 85% Số lượng nhận dạng đúng 54 Số lượng nhận dạng sai 13 Tỉ lệ nhận dạng đúng 81% Tốc độ xử lý <2s
Bảng 4.3: Bảng thống kê kết quả thử nghiệm trên tập dữ liệu.
3. Đánh giá kết quả:
Với kết quả nhận dạng trong bảng 4.3, chúng ta có những nhận xét đối với từng bài toán như sau:
• Trích biển số: thứ nhất tôi thực hiện ảnh chụp ở các điều kiện sáng tối khác nhau, và tôi nhận thấy là khi chụp ảnh với điều kiện buổi tối thì
kết quả trích biển số sẽ có kết quả cao hơn do đặc điểm biển số xe mô tô ở nước ta có độ phản chiếu ánh sáng vào ban đêm. Thứ hai là khoảng cách chụp ảnh cũng ảnh hưởng đến kết quả bài toán này rất nhiều. Trong tập ảnh chụp, có một số ảnh chụp quá xa hay quá gần sẽ không trích được đúng vị trí biển số. Thứ ba là do tính chất thuật toán là quét hết tất cả các điểm trên hình nhận được nên tốc độ xử lý không cao. Và trong thuật toán tôi đã giảm đi một số dòng ở đầu và ở cuối hay trái và phải ảnh ( vì ảnh biển số thường chụp ở vị trí nằm giữa hình) việc này góp phần làm tăng tốc độ xử lý ảnh .
• Tách ký tự: kết quả tách ký tự trong bảng 4.3 không đạt tỷ lệ cao do chương trình chưa xử lý hết nhiễu trong ảnh. Một số biển số nhiễu do đinh ốc, dơ, bùn đất, …làm ảnh hưởng đến việc tách ký tự và làm giảm hiệu quả nhận dạng. Một số trường hợp do nhiễu quá nhiều nên khi lọc nhiễu đã làm mất đi hay tăng thêm một số ký tự trên biển số và gây khó khăn cho việc nhận dạng. Và đây cũng là một vấn đề nan giải cho thuật toán này.
• Nhận dạng ký tự: giai đoạn nhận dạng ký tự sẽ phụ thuộc rất nhiều vào giai đoạn trích biển số và tách ký tự. Nếu trích biển số và tách ký tự tốt thì kết quả nhận dạng sẽ tốt. Tuy nhiên nếu ảnh ký tự bị nhiễu quá nhiều cũng sẽ dẫn đến việc nhận dạng ký tự bị lỗi. Ngoài ra do số ký tự chữ thu thập được trên biển số khá ít (mỗi biển số chỉ có 1 hoặc 2 ký tự chữ) nên việc huấn luyện cho các ký tự chữ chưa hoàn chỉnh và việc nhận dạng chưa có kết quả tốt. Đối với các ký tự số thì thu thập được khá nhiều, tuy nhiên trong quá trình nhận dạng ký tự thì sẽ dễ bị nhầm lẫn giữa các ký tự 0 và 8, 2 và 7, hay 5 và 6. Để giải quyết trường hợp này trong thuật toán nhận dạng đã đưa vào các hàm dùng để phân biệt các số 0-8, 2-7, 5-6. Với việc hỗ trợ phân biệt kết quả nhận dạng các ký tự trên thì kết quả nhận dạng các ký tự số khả quan hơn, tuy nhiên chúng ta khó mà phân biệt được những ký tự quá nhiễu.
Tóm lại các kết quả nhận dạng cuối cùng vẫn chưa thực sự tốt, do xử lý nhiễu chưa được tốt trên biển số. Nếu có được cơ sở dữ liệu các thông tin biển số thì chắc chắn sẽ đạt hiệu quả tốt hơn trong việc nhận dạng.
4. Một số kết quả minh họa thử nghiệm thuật toán:
• Trường hợp 1: ảnh chụp ban ngày