Phân loại chữ số cho các camera nhận diện biển số giao thông tại Việt Nam

8 36 0
Phân loại chữ số cho các camera nhận diện biển số giao thông tại Việt Nam

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài viết trình bày một phương pháp giúp cải thiện độ chính xác trong việc nhận dạng các kí tự khó bằng cách xây dựng một bộ phân loại 2 lớp. Trong đó, bộ phân loại thứ nhất được áp dụng cho tất cả các loại ký tự, bộ phân loại thứ 2 có tác dụng phân loại lại các ký tự khó, nhằm sửa lại những lỗi phân loại của bộ phân loại thứ nhất.

ISSN: 1859-2171 e-ISSN: 2615-9562 TNU Journal of Science and Technology 225(06): 451 - 458 PHÂN LOẠI CHỮ SỐ CHO CÁC CAMERA NHẬN DIỆN BIỂN SỐ GIAO THÔNG TẠI VIỆT NAM Lê Hữu Tơn*, Nguyễn Hồng Hà Trường Đại học Khoa học Cơng nghệ Hà Nội TĨM TẮT Nhận dạng ký tự toán nghiên cứu quan trọng áp dụng nhiều toán thực tế, có tốn nhận dạng biển số xe cho camera giám sát giao thông Các tốn nhận dạng thường xây dựng mơ hình phân loại cho tất lớp Tuy nhiên, độ khó để phân loại lớp ký tự không đồng đều, số ký tự dễ bị phân loại nhầm kí tự khác Việc xây dựng mơ hình phân loại cho tất lớp ký tự dẫn đến việc dự đoán lớp ký tự có độ xác khác Trong báo này, chúng tơi trình bày phương pháp giúp cải thiện độ xác việc nhận dạng kí tự khó cách xây dựng phân loại lớp Trong đó, phân loại thứ áp dụng cho tất loại ký tự, phân loại thứ có tác dụng phân loại lại ký tự khó, nhằm sửa lại lỗi phân loại phân loại thứ Thực nghiệm tập liệu SHVN tập liệu chữ số trích xuất từ camera nhận dạng biển số Việt Nam cho thấy phương pháp đề xuất giúp cải thiện độ xác số ký tự đến 1,4% Từ khóa: Xử lý hình ảnh; nhận dạng ký tự; mạng nơron tích chập; học sâu; phân loại hình ảnh Ngày nhận bài: 18/5/2020; Ngày hồn thiện: 28/5/2020; Ngày đăng: 31/5/2020 CHARACTER RECOGNITION FOR LICENSE PLATE RECOGNITION TRAFFIC CAMERA IN VIETNAM Le Huu Ton*, Nguyen Hoang Ha University of Science and Technology of Hanoi ABSTRACT Optical Character Recognition (OCR) is an active research direction with many practical applications, including digital character classification for license plate recognition on traffic cameras The OCR models usually deploy a single classifier for all the categories in the dataset However, the classification difficulties among all the classes in the dataset are different, some characters are easier to be misclassified compared to the others Due to this reason, the classification performances across the classes are not equal In this paper, we deploy a 2-stage classifier in order to improve the classification accuracy for difficult classes The first classifier is used to classify all the classes while the second one is used only for difficult classes, in order to refine the predictions made by the first classifier The experiment results on two datasets SVHN and license plate characters demonstrate that the proposed method helps to enhance the classification accuracy of some difficult classes by 1.4% Keywords: Image processing; optical character recognition; convolutional neural network; deep learning; image classification Received: 18/5/2020; Revised: 28/5/2020; Published: 31/5/2020 * Corresponding author Email: le-huu.ton@usth.edu.vn http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn 451 Lê Hữu Tơn Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ ĐHTN Giới thiệu Phân loại ký tự toán nghiên cứu quan trọng áp dụng nhiều ứng dụng thực tế, có tốn nhận dạng biển số xe cho camera giám sát giao thơng Trong tốn phân loại, mơ hình phân loại thường nhận đầu vào ảnh ký tự dự đoán xem ký tự chứa ảnh ký tự Trong năm qua, có nhiều phương pháp cơng bố để giải toán Các phương pháp thường chia làm hai hướng Hướng thứ sử dụng đặc trưng thủ công đoạn ký tự [1], nét chữ [2] điểm đặc trưng [3] để trích xuất vector đặc trưng ký tự dùng vector đặc trưng để nhận dạng ký tự Ở hướng nghiên cứu thứ hai, cơng bố thường sử dụng thuật tốn học sâu với mạng nơron tích chập (convolutional neural network - CNN) để nhận dạng ký tự Một số công bố tiêu biểu kể đến mạng AlexNet [4], MobileNet [5] hay Population Based Augmentation [6] Nhận dạng chữ số toán riêng nhận dạng ký tự, ảnh đầu vào thuộc vào 10 ký tự từ đến Tính chất 10 lớp chữ số khác nhau: ví dụ số lượng mẫu tập liệu, mối quan hệ lớp chồng chéo lớp liệu khác Do vậy, số lớp chữ số trở nên khó nhận dạng lớp chữ số khác Vấn đề đặc tính cân liệu mô tả [7] Một số phương pháp giới thiệu để giải vấn đề AdaBoost [8] hay ensemble-based classifiers [9] Tuy nhiên, phương pháp chưa áp dụng thử nghiệm tập liệu nhận dạng chữ số Để nâng cao độ xác lớp chữ số khó tốn phân loại chữ số, chúng tơi đề xuất mơ hình sử dụng kết hợp phân loại CNN Bộ thứ sử dụng để phân loại tất lớp chữ số Bộ thứ hai dùng riêng để phân loại lớp chữ số khó 452 225(06): 451 - 458 Tùy vào kết phân loại CNN thứ nhất, mơ hình lựa chọn số ảnh thuộc lớp chữ số khó nhận dạng để nhận dạng lại Thực nghiệm hai tập liệu "The Street View House Number" [10] liệu chữ số biển số xe cho thấy phương pháp đề xuất giúp tăng khả nhận diện ký tự khó lên đến 1,4%, tỷ lệ đáng kể thực tế việc cải thiện phần trăm độ xác vượt 90% thường khó khăn Theo tìm hiểu chúng tôi, lần phương pháp kể áp dụng cho hai tập liệu Phần cịn lại báo trình sau Phương pháp phân loại ảnh chữ số sử dụng hai CNN trình bày phần Phần giới thiệu phân tích kết thực nghiệm Cuối cùng, phần đưa kết luận phương pháp đề xuất Phương pháp nghiên cứu Trong phần chúng tơi trình bày phương pháp đề xuất nhằm cải thiện độ xác số lớp ký tự khó nhận diện Hầu hết phương pháp nhận diện ký tự sử dụng thuật tốn học sâu với mơ hình mạng nơron tích chập CNN Đặc điểm phương pháp mô hình có khả tự học đặc trưng tốt tập liệu huấn luyện tiến hành phân loại Khi huấn luyện mơ hình nhằm phân loại tất chữ số (0-9), mạng CNN cố học đặc trưng để phân loại tất kí tự dựa hàm tối ưu nhằm thu tỉ lệ nhận diện cao toàn tập liệu Tuy nhiên, tùy vào tập liệu khác nhau, độ khó việc phân loại lớp ký tự khác Việc huấn luyện mơ hình để học đặc trưng sử dụng chung cho tất lớp ký tự dẫn đến độ xác lớp ký tự khác Một số lớp ký tự dễ phân biệt cho độ xác cao, đó, ký tự khó phân biệt có độ xác thấp Việc gia tăng độ phức tạp mạng CNN (gia tăng số lớp, số lọc lớp) thường làm tăng đáng kể tốc http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn Lê Hữu Tơn Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN 225(06): 451 - 458 Hình Các bước xử lý phương pháp độ tính tốn nhiều không giải triệt để vấn đề (do mô hình học đặc trưng tốt cho liệu không tập trung giải lớp liệu khó) Xuất phát từ nguyên nhân trên, đề xuất sử dụng thêm mạng CNN huấn luyện riêng cho ký tự khó Sau sử dụng mạng CNN chung (sau gọi CNN-1) để phân loại ký tự, lọc trường hợp kí tự khó, có độ xác thấp đưa vào CNN thứ hai (sau gọi CNN-2) Do mạng CNN-2 huấn luyện để nhận dạng ký tự khó, cố học đặc trưng tốt để nhận dạng ký tự khó (thay đặc trưng để nhận dạng tất ký tự), độ xác việc nhận diện ký tự khó cải thiện đáng kể Các bước thực phương pháp mơ tả hình - Huấn luyện mạng CNN chung để nhận diện lớp ký tự: Đối với toán phân loại ký tự có nhiều mơ hình CNN giới thiệu với độ phức tạp hiệu khác Trong khuôn khổ báo này, sử dụng mạng CNN MobileNet [5] AlexNet [4], mạng CNN đơn giản có tốc độ tính tốn nhanh, giúp nhận dạng ký tự có khả đáp ứng yêu cầu chạy thời gian thực Chúng hiểu rõ, khơng phải mạng CNN có độ xác cao hay chạy nhanh cho tập liệu nhận dạng chữ số Các mạng lựa chọn với mục đích kiểm tra tính hiệu mơ hình CNN lớp so với việc sử dụng mơ hình CNN - Xác định ký tự khó nhận diện: Việc xác định ký tự khó nhận diện phụ thuộc http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn vào tập liệu ứng dụng Trong nghiên cứu chúng tôi, việc xác định dựa vào ma trận nhầm lẫn (confusion matrix) Với toán, liệu thường chia làm phần, tập huấn luyện (training data), tập liệu xác thực (validation data) tập liệu kiểm thử (testing data) Mơ hình huấn luyện dựa liệu huấn luyện lựa chọn dựa độ xác tập liệu xác thực Mơ hình có độ xác cao liệu xác thực chọn làm mơ hình cuối Mơ hình kiểm nghiệm tập liệu kiểm thử để đưa độ xác cuối mơ hình Thơng thường, tập liệu huấn luyện, xác thực lựa chọn cho chúng có tính chất, độ phức tạp, độ phân bố so với liệu kiểm thử Sau mơ hình huấn luyện, chúng tơi tính tốn ma trận nhầm lẫn mơ hình tập liệu xác thực từ tìm lớp chữ số hay bị nhầm lẫn với Chúng huấn luyện thêm phân loại CNN-2 để kiểm tra lại kết nhận diện lớp chữ số khó - Huấn luyện mạng CNN để nhận diện ký tự khó: Sau xác định lớp chữ số khó nhận diện hay bị nhầm lẫn với nhau, sử dụng chữ số thuộc lớp để xây dựng phân loại CNN-2 dành cho lớp chữ số khó Chúng sử dụng lại tập liệu huấn luyện, xác thực kiểm thử bước trước để xây dựng phân loại CNN Tuy nhiên, thay sử dụng tồn lớp liệu, chúng tơi sử dụng lớp chữ số khó, có độ xác thấp để huấn luyện nhận diện Ở bước này, sử dụng mạng CNN có 453 Lê Hữu Tơn Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN cấu trúc giống khác so với CNN-1 sử dụng bước Tuy nhiên, để kết thực nghiệm đánh giá cách khách quan không phụ thuộc vào việc lựa chọn cấu trúc mạng CNN, sử dụng chung cấu trúc mạng CNN sử dụng bước với thay đổi thay đổi số lượng đầu (output) mạng CNN - Kết hợp hai CNN để tăng độ xác: bước này, giả thiết CNN2 có độ xác cao so với CNN1 việc phân loại lớp chữ số khó Giả thiết khả thi CNN-2 huấn luyện để tối ưu hóa khả nhận diện cho ảnh thuộc lớp chữ số này, thay tối ưu khả nhận diện cho tất lớp chữ số Vấn đề đặt làm để xác định ảnh cần phân loại lại CNN-2 Với ảnh đầu vào, phân loại CNN-1 trả xác suất mà ảnh đầu vào thuộc lớp chữ số Kết nhận diện cuối chọn lớp chữ số có xác suất cao Mục đích CNN-2 phân loại lại ảnh thuộc lớp chữ số khó phân loại Nhằm tránh khỏi việc CNN-2 phân loại lại ảnh thuộc lớp chữ số khác, lựa chọn phân loại lại ảnh mà hai xác suất cao đề xuất với CNN-1 thuộc vào lớp chữ số khó hay bị nhận dạng nhầm Kết bàn luận Tập liệu: Để minh họa cho mơ hình phân loại mình, chúng tơi sử dụng tập liệu sau đây: - Tập liệu "The Street View House Number (SVHN)" [10] Đây tập liệu chứa ảnh chữ số giới thực Tập liệu thu thập từ ảnh số nhà thuộc Google Street View Mỗi ảnh tập SVHN có kích thước 32 x 32 SVHN bao gồm 73.257 ảnh tập huấn luyện 26.032 ảnh tập kiểm thử Chúng sử dụng phần liệu tập huấn luyện để xây dựng xác thực với tỷ lệ 8-2, 58.606 ảnh 454 225(06): 451 - 458 sử dụng để huấn luyện mơ hình, 14.651 ảnh sử dụng để xác thực mơ hình - Tập liệu chữ số biển số xe Việt Nam: tập liệu thu thập từ camera nhận diện biển số Việt Nam, bao gồm biển số xe ô tô biển số xe máy Các ảnh liệu có kích thước 30 x 50 Để thống với liệu SVHN, tiến hành nhận diện chữ số tạm thời bỏ qua kí tự Bộ liệu bao gồm 21.900 ảnh, với 10 lớp chữ số (0-9) Trong thực nghiệm mình, chúng tơi sử dụng 14.235 ảnh để huấn luyện mơ hình, 3.285 ảnh để xác thực mơ hình 4.380 ảnh để kiểm thử mơ hình Các ảnh liệu thu nhiều camera, điều kiện ánh sáng khác nhau, ảnh có ảnh (background) đồng cắt từ biển số xe Tuy nhiên, đặc điểm ảnh trích xuất từ xe chuyển động, nên ảnh bị ảnh hưởng nhiều nhiễu chuyển động Do ảnh hưởng nhiễu chuyển động, số chữ số dễ bị nhầm sang chữ số khác, đặc biệt lớp chữ số (ví dụ ảnh số hàng 2, hình 2b) Đặc điểm xảy với liệu ảnh tĩnh khác Một số mẫu ảnh tập liệu minh họa hình - Xây dựng CNN-1 cho tất lớp chữ số: Ở bước dùng liệu huấn luyện để xây dựng mơ hình nhận diện nhận diện tất lớp chữ số Mơ hình nhận diện lựa chọn mơ hình có độ xác nhận diện cao tập xác thực Độ xác nhận diện thể bảng Chúng ta thấy hầu hết phương pháp cho độ xác 90% Độ xác tập liệu biển số xe có độ xác cao so với tập SVHN tính chất tập liệu Các chữ số liệu biển số xe thường dễ phân biệt hơn, sử dụng phơng chữ nhiễu http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn Lê Hữu Tôn Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN Bảng Độ xác nhận dạng chữ số hai mạng AlexNet, MobileNet với hai tập liệu SVHN biển số xe Tập liệu AlexNet MobileNet SVHN 93,67 (%) 91,53 (%) Biển số xe 97,26 (%) 98,52 (%) - Xác định lớp chữ số khó nhận diện Để xác định lớp chữ số khó nhận diện, dựa vào ma trận nhầm lẫn CNN-1 liệu xác thực Hình thể ma trận nhầm lẫn nhận dạng tập liệu khác Đối với tập liệu SVHN, thấy số lớp liệu có độ nhận diện xác chưa cao số (88,1%), số (88,6%) Trong có 3,1% số bị nhầm thành số 5, 2,2% số bị nhầm sang số 3, 4,4% số bị nhầm thành số 6, 2,2% số bị nhầm thành số Như vậy, xây dựng thêm CNN-2 để phân biệt lớp chữ số 5, Chúng lựa chọn xây dựng phân loại cho chữ số Bộ phân loại lớp chữ số làm tương tự Những ảnh mà phân loại CNN-1 trả hai xác suất cao đưa vào kiểm tra lại sử dụng CNN-2 Trong thực nghiệm chúng tơi, có 846/1155 tổng số 26032 ảnh kiểm thử phải chạy qua CNN-2 với mạng AlexNet MobileNet Điều dẫn đến thời gian tính tốn tăng thêm 3,2% 4,4% Đối với tập liệu biển số, việc xác định lớp chữ số khó phân loại phức tạp Thay có lớp kí tự hay bị phân loại nhầm cho tập SVHN, tập liệu biển số có lớp kí tự hay bị nhầm lẫn chéo với Ví dụ, có 4,2% số bị nhầm sang số 6, 3,2% 225(06): 451 - 458 số bị nhầm sang số 5, 2,2% số bị nhầm sang số 8, 1,5% số bị nhầm sang số Do đó, với tập liệu xác định lớp kí tự khó phân biệt lớp chữ số 5, lớp chữ số lớp chữ số Bộ phân loại thứ dùng để phân loại lớp chữ số Những ảnh mà phân loại CNN-1 trả hai xác suất cao trùng với tập sau đưa vào phân loại lại phân loại thứ hai: (5,6), (6,8) (5,8) Trong thực nghiệm chúng tơi, có 183/256 tổng số 4380 ảnh kiểm thử phải chạy qua CNN-2 với mạng AlexNet MobileNet Điều tương đương với việc thời gian tính tốn tăng thêm 4,2% 5,8% Độ xác phân loại thứ thể bảng Có thể thấy độ xác phân loại thường cao độ xác phân loại phải tập trung phân loại số lớp liệu Kết hợp hai CNN để tăng độ xác Do CNN-2 thường có độ xác cao CNN-1, kết hợp nhận dạng nhìn chung giúp gia tăng độ xác tồn hệ thống Hình thể ma trận nhầm lẫn tập liệu trước sau kết hợp với phân loại CNN-2 Độ xác việc phân loại lớp chữ số khó tăng lên đáng kể Bảng thể độ xác việc phân loại lớp chữ số khó tổng hợp thời gian tính tốn cần tăng thêm việc sử dụng CNN Có thể thấy, với phương pháp đề xuất, độ xác cho lớp chữ số khó tăng lên khoảng 1,4% với u cầu tăng thêm 4,4% thời gian tính tốn Hình Bộ liệu sử dụng thực nghiệm: (a) SVHN, (b) biển số xe http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn 455 Lê Hữu Tơn Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN Bảng Độ xác nhận dạng lớp chữ số khó hai mạng AlexNet, MobileNet với hai tập liệu SVHN biển số xe Tập liệu AlexNet MobileNet SVHN (6-8) 96,1 (%) 95,7 (%) Biển số xe (5,6,8) 98,86 (%) 99,12 (%) Như vậy, liệu tăng thêm số lớp mạng CNN có tiếp tục cải thiện độ xác mơ hình? Chúng tơi thử nghiệm sử dụng thêm lớp CNN thứ để phân loại lại chữ số khó độ xác mơ hình gần khơng cải thiện Với liệu, nghiên cứu ma trận nhầm lẫn sau sử dụng mạng CNN lớp cho thấy, lớp chữ số khó chọn để phân loại mạng CNN-2 khơng cịn lớp chữ số có độ xác thấp hẳn lớp khác Việc 225(06): 451 - 458 huấn luyện thêm lớp CNN thứ lại cho lớp chữ số khó khơng cải thiện độ xác so với lớp CNN-2 Thêm nữa, phương pháp đề xuất thích hợp tìm số lớp chữ số hay bị nhầm với Nếu lớp chữ số có độ xác thấp ma trận nhầm lẫn phân bố cho lớp chữ số khác khó định huấn luyện lớp CNN-2 cho lớp chữ số Do vậy, đề xuất dừng lại việc sử dụng lớp CNN, thay tiếp tục gia tăng số lớp CNN mơ hình Kết luận Trong báo này, chúng tơi trình bày phương pháp sử dụng mạng CNN lớp để cải thiện độ xác số lớp liệu khó phân loại Hình Ma trận nhầm lẫn nhận dạng CNN-1 với tập liệu xác thực: (a) SHVN MobileNet, (b) biển số xe AlexNet Hình Ma trận nhầm lẫn mơ hình MobileNet tập liệu SVHN: (a) sử dụng mạng CNN-1, (b) kết hợp mạng CNN 456 http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn Lê Hữu Tôn Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN 225(06): 451 - 458 Hình Ma trận nhầm lẫn mơ hình AlexNet tập liệu biển số xe: (a) sử dụng mạng CNN-1, (b) kết hợp mạng CNN Bảng Độ xác phân loại kí tự khó thời gian tính tốn cần tăng thêm AlexNet [4] MobileNet [5] CNN CNN Thời gian CNN CNN Thời gian SVHN (6-8) 91,9 (%) 92,75 (%) +3,2 (%) 88 (%) 89,9(%) +4,4 (%) Biển số xe (5,6,8) 93,2 (%) 95,1 (%) +4,2 (%) 96,8 (%) 97,5 (%) +5,8 (%) Kết thực nghiệm cho thấy phương pháp giúp gia tăng độ xác lớp liệu lên khoảng 1,4% với thêm 4,4% thời gian tính tốn Nên nhớ rằng, độ xác vượt ngưỡng 95%, việc cải thiện dù 1% độ xác vơ khó khăn Tính hiệu phương pháp chứng minh tập liệu nhận dạng chữ số, nhiên, phương pháp áp dụng cho nhiều liệu khác mà độ khó việc nhận dạng lớp liệu không đồng [3] [4] Lời cảm ơn Bài báo hỗ trợ Học viện Khoa học Công nghệ, Viện Hàn lâm Khoa học Công nghệ Việt Nam thông qua nhiệm vụ khoa học mã số GUST.STS.NV2017-TT01 TÀI LIỆU THAM KHẢO/ REFERENCES [1] C Yao, X Bai, B Shi, and W Liu, “Strokelets: A learned multi-scale representation for scene text recognition,” In Proceedings of the IEEE Conference on Computer Vision and PatternRecognition (CVPR), 2014, pp 4042-4049 [2] M Buta, L Neumann and J Matas, "FASText: Efficient Unconstrained Scene http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn [5] [6] [7] Text Detector," 2015 IEEE International Conference on Computer Vision (ICCV), Santiago, 2015, pp 1206-1214, doi: 10.1109/ICCV.2015.143 T Q Phan, P Shivakumara, S Tian, and C L Tan, “Recognizing text with perspective distortion in natural scenes,” In Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2013, pp 569-576 A Krizhevsky, I Sutskever, and G Hinton, “ImageNet Classification with Deep Convolutional Neural Networks,” In Proceedings of the 25th International Conference on Neural Information Processing Systems - Volume (NIPS), 2012 A Howard, M Zhu, B Chen, D Kalenichenko, W Wang, T Weyand, M Andreetto, and H Adam, MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications, 2017 [Online] Available: http://arxiv.org/abs/1704.04861 [Accessed May 12, 2018] D Ho, E Liang, I Stoica, P Abbeel, and X Chen, Population Based Augmentation: Efficient Learning of Augmentation Policy Schedules, 2019, [Online] Available: https://arxiv.org/abs/1905.05393 [Accessed May 12, 2019] M Galar, A Fernández, E Barrenechea, H Bustince, and F Herrera, “A review on ensembles for the class imbalance problem: 457 Lê Hữu Tơn Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ ĐHTN bagging-, boosting-, and hybrid-based approaches,” IEEE Trans Syst., Man, Cybernet., Part C: Appl Rev., vol 42, no 4, pp 463-484, 2012 [8] Freund, and R E Schapire, “A decisiontheoretic generalization ofon-line learning and an application to boosting,” J Comput Syst Sci., vol 55, no 1, pp 119-139, 1997 458 225(06): 451 - 458 [9] L Rokach, “Ensemble-based classifiers,”Artif Intell Rev., vol 33, pp 1-39, 2010 [10] Y Netzer, T Wang, A Coates, A Bissacco, B Wu, and Y Andrew, “Reading Digits in Natural Images with Unsupervised Feature Learning NIPS,” Workshop on Deep Learning and Unsupervised Feature Learning, 2011 http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn ... dụng để xác thực mơ hình - Tập liệu chữ số biển số xe Việt Nam: tập liệu thu thập từ camera nhận diện biển số Việt Nam, bao gồm biển số xe ô tô biển số xe máy Các ảnh liệu có kích thước 30 x 50... nghiệm tập liệu nhận dạng chữ số Để nâng cao độ xác lớp chữ số khó tốn phân loại chữ số, chúng tơi đề xuất mơ hình sử dụng kết hợp phân loại CNN Bộ thứ sử dụng để phân loại tất lớp chữ số Bộ thứ hai... so với CNN1 việc phân loại lớp chữ số khó Giả thiết khả thi CNN-2 huấn luyện để tối ưu hóa khả nhận diện cho ảnh thuộc lớp chữ số này, thay tối ưu khả nhận diện cho tất lớp chữ số Vấn đề đặt làm

Ngày đăng: 01/11/2020, 03:22

Hình ảnh liên quan

Hình 1. Các bước xử lý chính của phương pháp - Phân loại chữ số cho các camera nhận diện biển số giao thông tại Việt Nam

Hình 1..

Các bước xử lý chính của phương pháp Xem tại trang 3 của tài liệu.
Hình 3. Ma trận nhầm lẫn của bộ nhận dạng CNN-1 với tập dữ liệu xác thực: (a) SHVN và MobileNet, (b) biển số xe và AlexNet - Phân loại chữ số cho các camera nhận diện biển số giao thông tại Việt Nam

Hình 3..

Ma trận nhầm lẫn của bộ nhận dạng CNN-1 với tập dữ liệu xác thực: (a) SHVN và MobileNet, (b) biển số xe và AlexNet Xem tại trang 6 của tài liệu.
Bảng 2. Độ chính xác của bộ nhận dạng các lớp chữ số khó của hai mạng AlexNet, MobileNet với  - Phân loại chữ số cho các camera nhận diện biển số giao thông tại Việt Nam

Bảng 2..

Độ chính xác của bộ nhận dạng các lớp chữ số khó của hai mạng AlexNet, MobileNet với Xem tại trang 6 của tài liệu.
Hình 5. Ma trận nhầm lẫn của mô hình AlexNet trên tập dữ liệu biển số xe:  (a) sử dụng 1 mạng CNN-1, (b) kết hợp 2 mạng CNN  - Phân loại chữ số cho các camera nhận diện biển số giao thông tại Việt Nam

Hình 5..

Ma trận nhầm lẫn của mô hình AlexNet trên tập dữ liệu biển số xe: (a) sử dụng 1 mạng CNN-1, (b) kết hợp 2 mạng CNN Xem tại trang 7 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan