7. Kết quả dự kiến
2.6. MỘT SỐ VẤN ĐỀ QUÁ KHỚP VÀ HƯỚNG GIẢI QUYẾT
Vấn đề quá khớp:
Xảy ra khi mạng được luyện quá sát với dữ liệu huấn luyện, bởi vậy nó sẽ trả lời chính xác những gì đã được học, còn những gì không được học thì
nó không quan tâm. Như vậy mạng sẽkhông có được khảnăng tổng quát hóa.
Về mặt toán học, một giả thuyết (mô hình) h được gọi là quá khớp nếu tồn tại giả thuyết h' sao cho:
1. Error train (h) < Error train (h') 2. Error test (h) > Error test (h')
Giải quyết quá khớp:
Vấn đề quá khớp xảy ra vì mạng có năng lực quá lớn. Có 3 cách để hạn
chế bớt năng lực của mạng:
– Hạn chế số nút ẩn
– Ngăn không cho mạng sử dụng các trọng số lớn
– Giới hạn sốbước luyện
Khi mạng được luyện, nó chuyển từ các hàm ánh xạ tương đối đơn giản
đến các hàm ánh xạ tương đối phức tạp. Nó sẽ đạt được một cấu hình tổng quát hóa tốt nhất tại một điểm nào đó. Sau điểm đó mạng sẽ học để mô hình hóa nhiễu, những gì mạng học được sẽ trở thành quá khớp. Nếu ta phát hiện ra thời điểm mạng đạt đến trạng thái tốt nhất này, ta có thể ngừng tiến trình
luyện trước khi hiện tượng quá khớp xảy ra.
Ta biết rằng, chỉ có thểđểđánh giá mức độ tổng quát hóa của mạng bằng cách kiểm tra mạng trên các mẫu nó không được học. Ta thực hiện như sau:
chia mẫu thành tập mẫu huấn luyện và tập mẫu kiểm tra. Luyện mạng với tập mẫu huấn luyện nhưng định kỳ dừng lại và đánh giá sai số trên tập mẫu kiểm tra. Khi sai số trên tập mẫu kiểm tra tăng lên thì quá khớp đã bắt đầu và ta dừng tiến trình luyện.
Chú ý rằng, nếu sai số kiểm tra không hề tăng lên, tức là mạng không có
đủ số nút ẩn để quá khớp. Khi đó mạng sẽ không có đủ số nút cần thiết để
thực hiện tốt nhất. Do vậy nếu hiện tượng quá khớp không hề xảy ra thì ta cần
bắt đầu lại nhưng sử dụng nhiều nút ẩn hơn.
Hình 2.10. Mạng quá khớp với mẫu huấn luyện
Kết luận
Việc thiết kế một mạng nơron khi các biến đầu vào đã được chọn gồm các bước sau:
B1: Chọn cấu hình ban đầu, thường một lớp ẩn có số nơronẩn bằng nửa
tổng sốnơronđầu vào và đầu ra.
B2: Thực hiện lặp đi lặp lại số thí nghiệm của mỗi cấu hình, giữ lại mạng
tốt nhất dựa trên sai số xác minh. Thí nghiệm nhiều lần trên mỗi cấu hình
mạng đểtránh rơi vào sai số cục bộ.
B3: Trong mỗi lần thí nghiệm, nếu xảy ra việc học chưa đủ, mạng chưa
đạt được mức hiệu suất chấp nhận thì thửtăng số nơron trong lớp ẩn. Nếu vẫn
không hiệu quả, thì chúng ta cần tăng thêm một lớp ẩn.
B4: Nếu xảy ra học quá mức, tức là sai số xác minh bắt đầu tăng thì ta
thử bỏ bớt vài nơronẩn hoặc có thể bỏ lớp ẩn.
B5: Chọn phương pháp cải thiện tổng quát hóa để cải thiện mạng.
KẾT LUẬN CHƯƠNG 2:
Chương này giới thiệu về hệ thống nhận diện biển số xe cơ bản, các
bước xử lý, các phương pháp khác nhau để có thể nhận dạng một biển số xe.
Bên cạnh đó, chương 2 cũng nêu một số cải tiến trong kỹ thuật xử lý ảnh nhằm nâng cao hiệu năng của hệ thống nhận dạng. Ngoài ra, chúng ta còn
được tìm hiểu tổng quát về mạng nơron nhân tạo, cách thức xây dựng cũng
CHƯƠNG 3
ỨNG DỤNG MẠNG NƠRON ĐỂ NHẬN DẠNG KÝ TỰ CHO HỆ THỐNG NHẬN DẠNG BIỂN SỐ XE
3.1. MÔ HÌNH TỔNG QUÁT HỆ THỐNG NHẬN DẠNG BIỂN SỐ XE
Hình 3.1. Mô hình tổng quát hệ thống nhận dạng biển số xe
Một hệ thống nhận dạng biển số xe có thể được mô tả như Hình 3.1. Ảnh
sau đó module tách ký tựđơn sẽ thực hiện tách ký tự trên biển sốxe trước khi
đưa nó vào module nhận dạng ký tự. Ký tự sau khi được nhận dạng sẽ kết
xuất và lưu vào cơ sở dữ liệu của chương trình.
3.2. QUÁ TRÌNH THU NHẬN ẢNH
Ở Việt Nam, biển số xe môtô được quy định như sau:
1. Về chất liệu của biển số: Biển số xe được sản xuất bằng kim loại, có sơn
phản quang, ký hiệu bảo mật; đối với biển sốxe đăng ký tạm thời được in trên giấy.
2. Ký hiệu, kích thước của chữ và số trên biển số đăng ký các loại xe thực
hiện theo quy định tại Phụ lục số 02, 03 và 04 ban hành kèm theo Thông
tư 36/2010/TT-BCA.
3. Biển số xe máy có kích thước như sau: loại biển số ngắn có chiều cao 200 mm, chiều dài 280 mm.
4. Biển số xe mô tô, gồm 1 biển gắn phía sau xe; kích thước: Chiều cao 140 mm, chiều dài 190 mm. Nhóm số thứ nhất là ký hiệu địa phương đăng ký xe
và sê ri đăng ký. Nhóm số thứ hai là thứ tự xe đăng ký gồm 04 hoặc 05 chữ số
tự nhiên từ 0001-9999 hoặc 000.01 đến 999.99.
Các điều kiện trình bày ở trên sẽ được tham số hóa trong hệ thống nhận
dạng của luận văn và mang tính chất tăng cường rang buộc ảnh đầu vào.
3.3. QUÁ TRÌNH TRÍCH BIỂN SỐ XE, XỬ LÝ ẢNH BIỂN SỐ VÀ TÁCH KÝ TỰ CHỮ SỐ XE