Để xây dựng hệ thống quản lý giao thông tự động thì “Bài toán nhận dạng biển số xe” là tiền đề để xây dựng mô hình quản lý đó, nhưng hiện nay ở Việt Nam những hệ thống quản lý đó còn chư
Trang 1TRƯỜNG ĐẠI HỌC KỸ THUẬT - HẬU CẦN CAND
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO CHUYÊN ĐỀ
Học phần: Những vấn đề mới trong công nghệ thông tin
và truyền thông
NHẬN DẠNG BIỂN SỐ XE TỪ DỮ LIỆU HÌNH ẢNH
Nhóm học viên: Trịnh Xuân Tiến
Lê Thị Nguyệt Nguyễn Thị Huyền Trang
Bắc Ninh, tháng 9 năm 2017
Trang 2TRƯỜNG ĐẠI HỌC KỸ THUẬT - HẬU CẦN CAND
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO CHUYÊN ĐỀ
Học phần: Những vấn đề mới trong công nghệ thông tin
và truyền thông
NHẬN DẠNG BIỂN SỐ XE TỪ DỮ LIỆU HÌNH ẢNH
GIÁO VIÊN HƯỚNG DẪN: TS Lương Khắc Định
Nhóm học viên: Trịnh Xuân Tiến
Lê Thị Nguyệt Nguyễn Thị Huyền Trang
Bắc Ninh, tháng 9 năm 2017
Trang 3LỜI CẢM ƠN
Trước hết, nhóm chúng em xin được gửi lời cảm ơn chân thành, sâu sắc đến thầy giáo TS Lương Khắc Định - giáo viên giảng dạy Trong thời gian qua giám sát đã luôn nhiệt tình hướng dẫn, chỉ bảo, trau dồi cho chúng em những kiến thức quý giá về kiến thức trong chuyên đề Sự gợi ý về ý tưởng, cung cấp tài liệu, số liệu, hướng dẫn của giám sát là một trong những nhân tố chính giúp chúng em hoàn thành tốt chuyên đề của mình
Chúng em xin chân thành cảm ơn các thầy, cô giáo khoa Công nghệ thông tin – Trường Đại học Kỹ thuật – Hậu cần CAND đã truyền đạt những kiến thức cần thiết, đồng thời tạo điều kiện thuận lợi cho chúng em học tập và nghiên cứu Điều đó có ý nghĩa hết sức to lớn đối với học viên chuyên ngành Công nghệ thông tin
Trong quá trình làm chuyên đề, do còn ít kinh nghiệm và kiến thức còn chưa sâu sắc nên chuyên đề của chúng em không tránh khỏi những sai sót Mong quý giám sát cô thông cảm và góp ý cho chúng em để chuyên đề được hoàn chỉnh hơn
Em xin chân thành cảm ơn!
Bắc Ninh, tháng 9 năm 2017
HỌC VIÊN
Trang 4i
MỤC LỤC DANH MỤC HÌNH ẢNH III
MỞ ĐẦU 1
CHƯƠNG 1 CƠ SỞ LÝ THUYẾT VỀ NHẬN DẠNG TỪ DỮ LIỆU HÌNH ẢNH 3
1.1 Tổng quan về nhận dạng 3
1.1.1 Khái niệm nhận dạng 3
1.1.2 Không gian biểu diễn đối tượng, không gian diễn dịch 3
1.1.3 Mô hình và bản chất của quá trình nhận dạng 4
1.2 Xử lý ảnh 6
1.2.1 Quá trình xử lý ảnh 6
1.2.2 Các vấn đề cơ bản trong xử lý ảnh 8
1.3 Công nghệ Tesseract OCR 9
1.3.1 Lịch sử 9
1.3.2 Kiến trúc hoạt động 10
CHƯƠNG 2 BÀI TOÁN NHẬN DẠNG BIỂN SỐ XE 11
2.1 Nhận dạng biển số xe 11
2.1.1 Khái niệm 11
2.1.2 Phân loại biển số xe 12
2.1.3 Những quy định về màu sắc và chữ số đặc biệt 13
2.2 Hướng giải quyết 15
2.2.1 Hướng tiếp cận phát triển vùng 15
2.2.2 Hướng tiếp cận dò biên và biến đổi Hough 15
2.2.3 Hướng giải quyết 16
2.3 Phát hiện vùng chứa biển số xe 17
2.4 Xác định chính xác vùng chứa biển số xe 19
2.5 Nhận dạng ký tự 20
2.5.1 Mô hình mạng notron nhân tạo 20
2.5.2 Phương pháp và thuật toán nhận dạng kí tự 24
CHƯƠNG 3 XÂY DỰNG CHƯƠNG TRÌNH NHẬN DẠNG BIỂN SỐ XE 28
3.1 Công cụ xây dựng 28
3.1.1 Microsoft Visual Studio 2013 28
3.1.2 Microsoft Net framework 28
3.2 Chương trình nhận dạng biển số xe 29
3.2.1 Giao diện chính của phần mềm 29
3.2.2 Các bước nhận diện biển số xe 29
3.3 Đánh giá sản phẩm demo 32
Trang 5ii
3.3.1 Giao diện 32
3.3.2 Tính năng, hiệu suất 32
3.3.3 Độ ổn định 32
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 33
TÀI LIỆU THAM KHẢO 34
Trang 6iii
DANH MỤC HÌNH ẢNH
Hình 1.1 Sơ đồ quá trình nhận dạng 6
Hình 1.2 Sơ đồ các bước cơ bản xử lý ảnh 6
Hình 1.3 Kiến trúc tesseract 10
Hình 2.1 Mẫu biển số xe 15
Hình 2.2 Các bước phát hiện vùng chứa biển số xe 17
Hình 2.3 Các bước xác định chính xác vùng chứa biển số xe 19
Hình 3.1 Giao diện chính của phần mềm 29
Hình 3.2 Button chọn hình 29
Hình 3.3 Bước lựa chọn hình ảnh có sẵn 30
Hình 3.4 Button chụp hình 30
Hình 3.5 Phát hiện vùng chứa biển số xe 30
Hình 3.6 Nhận dạng các ký tự 31
Hình 3.7 Xử lý hình ảnh 31
Hình 3.8 Nhận diện ký tự 31
Hình 3.9 Kết quả nhận diện 32
Trang 7Cùng với sự phát triển của khoa học kỹ thuật và nhu cầu đi lại ngày càng tăng,
số lượng phương tiện giao thông trên đường ngày càng xuất hiện nhiều Với số lượng phương tiện giao thông lớn, và còn không ngừng tăng lên như vậy đã làm nảy sinh nhiều vấn đề trong việc kiểm soát các phương tiện cũng như công tác quản lý, xử lý vi phạm giao thông mà nguồn nhân lực con người khó có thể thực hiện được Để giải quyết vấn đề này nhu cầu đặt ra là phải áp dụng các26 hệ thống quản lý, xử lý vi phạm giao thông tự động
Để xây dựng hệ thống quản lý giao thông tự động thì “Bài toán nhận dạng biển
số xe” là tiền đề để xây dựng mô hình quản lý đó, nhưng hiện nay ở Việt Nam những
hệ thống quản lý đó còn chưa nhiều và lĩnh vực nhận dạng đang còn trong quá trình phát triển
Từ những thực tế đó, trong thời gian học môn những vấn đề mới trong công nghệ thông tin, em đã quyết định lựa chọn tìm hiểu về đề tài: “Nghiên cứu nhận dạng biển số xe từ dữ liệu hình ảnh”
3 Mục tiêu nghiên cứu
Chúng em thực hiện đề tài: “Nhận dạng biển số xe từ dữ liệu hình ảnh” với mục tiêu cụ thể như sau:
- Tìm hiểu về quá trình xử lý và nhận dạng ảnh
- Tìm hiểu công nghệ Tesseract OCR
- Xây dựng phần mềm nhận dạng biển số xe từ dữ liệu hình ảnh
4 Phương pháp nghiên cứu
- Phương pháp nghiên cứu tài liệu: Nghiên cứu tài liệu có liên quan đến đề tài nhằm thu thập hệ thống các cơ sở lí luận của đề tài và nghiên cứu ứng dụng các phương pháp nghiên cứu khoa học phục vụ cho đề tài
- Phương pháp tham khảo từ các chuyên gia: Lấy ý kiến từ các giám sát cô giáo Khoa Công nghệ thông tin, giáo viên hướng dẫn đề tài nhằm định hướng quá trình nghiên cứu và đảm bảo kết quả nghiên cứu chính xác hơn
- Phương pháp thực nghiệm: Nghiên cứu các phần mềm nhận dạng đã xây dựng
có liên quan để phục vụ việc xây dựng mới phần mềm nhận dạng của nhóm
5 Phạm vi nghiên cứu
Trong khuôn khổ bài báo cáo kết thúc học phần môn Những vấn đề mới trong công nghệ thông tin, nhóm chúng em định hướng đề tài nghiên cứu về Công nghệ
Trang 82
Tesseract OCR và những phần mềm có liên quan đến nhận dạng biển số xe từ dữ liệu hình ảnh
6 Bố cục bài báo cáo
Trong báo cáo này, ngoài phần mở đầu và phần kết luận, nội dung báo cáo được chia làm 3 chương:
Chương 1: CƠ SỞ LÝ THUYẾT VỀ NHẬN DẠNG TỪ DỮ LIỆU HÌNH ẢNH 1.1 Tổng quan về nhận dạng
1.2 Xử lý ảnh
1.3 Công nghệ Tesseract OCR
Chương 2: BÀI TOÁN NHẬN DẠNG BIỂN SỐ XE 2.1 Nhận dạng biển số xe
2.2 Hướng giải quyết
2.3 Phát hiện vùng chứa biển số xe
Trang 91.1.2 Không gian biểu diễn đối tượng, không gian diễn dịch
Không gian biểu diễn đối tượng
Các đối tượng khi quan sát hay thu nhập được thường được biểu diễn bởi tập các đặc trưng hay đặc tính Như trong trường hợp xử lý ảnh, ảnh sau khi được tăng cường để nâng cao chất lượng, phân vùng và trích chọn đặc tính, được biểu diễn bởi các đặc trưng như biên, miền đồng nhất… Người ta thường phân các đặc trưng này theo các loại như: đặc trưng tô pô (tập điểm), đặc trưng hình học và đặc trưng chức năng Việc biểu diễn ảnh theo đặc trưng nào còn phụ thuộc vào ứng dựng tiếp theo
Ví dụ : giả sử đối tượng X (ảnh, chữ viết, dấu vân tay,…) được biểu diễn bởi n thành phần đặc trưng: 𝑋 = {𝑥1, 𝑥2, … , 𝑥𝑛}; mỗi 𝑥𝑖 biểu diễn một đặc tính Không gian biểu diễn đối tượng thường gọi tắt là không gian đối tượng A được định nghĩa:
𝐴 = {𝑥1, 𝑥2, … , 𝑥𝑛} Trong đó mỗi 𝑥𝑖 biểu diễn một đối tượng Không gian này có thể là vô hạn, nhưng để tiện xem xét thì ta chỉ xét tập hữu hạn
Không gian diễn dịch
Không gian diễn dịch là tập các tên gọi của đối tượng Kết thúc quá trình nhận dạng ta xác định được tên gọi cho các đối tượng trong tập không gian đối tượng hay nói là đã nhận dạng được đối tượng
Một hình thức gọi là Ω là tập tên đối tượng:
Ω = {𝜔1, 𝜔2, … , 𝜔𝑘} với 𝜔𝑖, i= 1,2,….k là tên các đối tượng
Quá trình nhận dạng đối tượng f là một ánh xạ f: AΩ với f là tập các quy luật
để định một phần tử trong A ứng với một phần tử trong Ω Nếu tập các quy luật và tập tên các đối tượng là biết trước như trong nhận dạng chữ viết có (có 26 lớp từ AZ), người ta gọi là nhận dạng có giám sát Trường hợp hai là nhận dạng không có giám sát (trường hợp này khó khăn hơn)
Trang 104
1.1.3 Mô hình và bản chất của quá trình nhận dạng
Mô hình quá trình nhận dạng
Việc chọn lựa một quá trình nhận dạng có liên quan mật thiết đến kiểu mô tả
mà người ta sử dụng để đặc tả đối tượng Trong nhận dạng, người ta phân chia theo hai
họ lớp:
- Họ mô tả theo tham số
- Họ mô tả theo cấu trúc
Cách mô tả được lựa chọn sẽ xác định mô hình của đối tượng Như vậy, chúng
sẽ có 2 loại mô hình: mô hình theo tham số và mô hình cấu trúc
- Mô hình tham số
Mô hình tham số sử dụng một vector để đặc đối tượng Mỗi phần tử của vector
mô tả một đặc tính của đối tượng
Ví dụ như trong các đặc trưng chức năng, người ta sử dụng các hàm cơ sở trực giao để biểu diễn Và như vậy ảnh sẽ được biểu diễn bởi một chuỗi các hàm trực giao
Giả sử C là đường bao của ảnh C(i,j) là điểm thứ i trên đường bao với i=1,2…,N ( đường bao gồm N điểm)
- Mô hình cấu trúc
Cách tiếp cận của mô hình này dựa vào việc mô tả đối tượng nhờ một số khái niệm biểu thị các đối tượng cơ sở trong ngôn ngữ tự nhiên Để mô tả đối tượng, người ta dùng một số dạng nguyên thủy như đoạn thẳng, cung Chẳng hạn một hình chữ nhật được định nghĩa gồm 4 đoạn thẳng vuông góc với nhau từng đôi một Trong mô hình
Trang 115
này người ta sử dụng một bộ kí hiệu kết thúc Vt, một bộ kí hiệu không kết thúc gọi là
Vn Ngoài ra còn dùng một tập các luật sản xuất để mô tả cách xây dựng các đối tượng phù hợp dựa trên các đối tượng đơn giản hơn hoặc đối tượng nguyên thủy Trong cách tiếp cận này, ta chấp nhận một khẳng định là: cấu trúc là kết quả của việc áp dụng luật sản xuất theo những nguyên tắc xác định bắt đầu từ một dạng gốc bắt đầu Một cách hình thức, chúng ta có thể coi mô hình này tương đương một văn phạm 𝐺 =(𝑉𝑡, 𝑉𝑛, 𝑃, 𝑆) với:
Quá trình nhận dạng gồm 3 giai đoạn chính:
- Lựa chọn mô hình biểu diễn đối tượng
- Lựa chọn luật ra quyết định (phương pháp nhận dạng) và suy diễn quá trình học
- Học nhận dạng
Khi mô hình biểu diễn đối tượng đã được xác định, có thể là định lượng (mô hình tham số) hay định tính (mô hình cấu trúc), quá trình nhận dạng chuyển sang giai đoạn học Học là giai đoạn quan trọng Thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập đối tượng thành lớp
Việc nhận dạng chính là tìm ra quy luật và các thuật toán để có thể gán đối tượng vào một lớp hay nói một cách khác gán cho đối tượng một tên
- Học có giám sát (supervised learning)
Kỹ thuật phân loại nhờ kiến thức biết trước gọi là học có giám sát.[1] Đặc điểm
cơ bản của kỹ thuật này là người ta có một thư viện các mẫu chuẩn Mẫu cần nhận dạng sẽ được đem so sánh với mẫu chuẩn để xem nó thuộc loại nào Ví dụ như trong một ảnh viễn thám, người ta muốn phân biệt một cách đồng lúa, một cánh rừng hay một vùng đất hoang mà đã có miêu tả về đối tượng đó Vấn đề chủ yếu là thiết kế một
hệ thống để có thể đối sánh đối tượng trong ảnh với mẫu chuẩn và quyết định gán cho chúng vào một lớp Việc đối sánh nhờ vào các thủ tục ra quyết định dựa trên một công
cụ gọi là hàm phân lớp hay hàm ra quyết định
- Học không có giám sát (non supervised learning)
Kỹ thuật này phải tự định ra cách lớp khác nhau và xác định các tham số đặc trưng cho từng lớp.[1] Học không có giám sát khó khăn hơn Một mặt, do số lớp không được biết trước, mặt khác những đặc trưng của lớp cũng không biết trước Kỹ thuật này nhằm tiến hành mọi cách gộp nhóm có thể và chọn lựa cách tốt nhất Bắt đầu
Trang 121.2.1 Quá trình xử lý ảnh
Xử lý ảnh là một trong những mảng quan trọng nhất trong kỹ thuật thị giác máy tính, là tiền đề cho nhiều nghiên cứu thuộc lĩnh vực này Hai nhiệm vụ cơ bản của quá trình xử lý ảnh là nâng cao chất lượng thông tin hình ảnh và xử lý số liệu cung cấp cho các quá trình khác trong đó có việc ứng dụng thị giác vào điều khiển Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh
“tốt hơn” hoặc một kết luận
Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (máy ảnh, máy quay, ) Trước đây, ảnh thu được là các ảnh tương tự (loại camera ống kiểu CCIR) Gần đây, với sự phát triển cua công nghệ, ảnh màu hoặc đen trắng được lấy ra
từ máy ảnh và được truyền trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo Ngoài ra, ảnh cũng có thể tiếp nhận từ vệ tinh, có thể quét từ ảnh chụp bằng máy quét ảnh
Sơ đồ tổng quát các bước cơ bản xử lý ảnh:
Hình 1.2 Sơ đồ các bước cơ bản xử lý ảnh
Trang 137
- Thu nhận ảnh (Image Acquisition)
Ảnh có thể nhận qua camera màu hoặc đen trắng Thường ảnh nhận qua camera
là ảnh tương tự (camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng) hoặc loại camera đã số hóa (loại CCD - Change Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh
Camera thường dùng là loại quét dòng, ảnh tạo ra có 2 chiều Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh)
- Tiền xử lý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền
xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn
- Phân đoạn hay phân vùng ảnh (Segmentation)
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Đây là phần phức tạp nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết qua nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này
Để nhận dạng chữ hoặc mã vạch trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ cái, chữ số hoặc vạch riêng biệt để nhận dạng
- Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau khi phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lân cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính chất
để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi nhận được
Trong nhận dạng kí tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng kí tự giúp phân biệt kí tự này với kí tự khác
- Nhận dạng và nội suy ảnh (Image Recognization and Interpetation)
Nhận dạng ảnh là quá trình xác định ảnh thường thu bằng cách so sánh với mẫu chuẩn đã được học hoặc lưu từ trước Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng Một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại
Có nhiều cách phân loại khác nhau về ảnh có thể phân theo hai loại nhận dạng ảnh cơ bản là nhận dạng theo tham số và nhận dạng theo cấu trúc Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là
Trang 148
nhận dạng ký tự, nhận dạng văn bản, nhận dạng vân tay, nhân dạng mã vạch, nhận dạng mặt người,…
- Cơ sở tri thức (Knowlegde Base)
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượn điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu Trong nhiều khâu xử lý và phân tích ảnh, ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý theo phương pháp trí tuệ con người Vì vậy, cần có cơ sở tri thức về đối tượng ảnh trong quá trình nhận dạng
1.2.2 Các vấn đề cơ bản trong xử lý ảnh
Các khái niệm cơ bản
Ảnh và điểm ảnh (pixel): Ảnh là mảng số thực hai chiều (𝐼𝑚,𝑛) có kích thước (MxN), trong đó mỗi giá trị 𝐼𝑚,𝑛 tại một điểm ảnh biểu thị mức xám của ảnh tại vị trí (m,n) tương ứng Một ảnh là ảnh nhị phân nếu giá trị 𝐼𝑚,𝑛 băng 0 hoặc 1.[3]
Mức xám: là kết quả sự mã hóa tương ứng một cường độ sáng của mỗi điểm
ảnh với một giá trị số (kết quả của quá trình lượng hóa).[3] Cách mã hóa kinh điển thường dùng là 16, 32, 64 Mã hóa 256 mức là phổ dụng nhất do lý do kỹ thuật (vì
28 = 256 nên với 256 mức, mỗi pixel được mã hóa 8 bit)
Đối tượng ảnh: Xét một ảnh nhị phân, kí hiệu E là tập các điểm vùng (điểm đen)
và 𝐸̅ là tập các điểm nền (điểm trắng).[3] Hai điểm 𝐼𝑠 và 𝐼𝑒 ∈ 𝐼𝑚,𝑛 nằm trong E (hoặc 𝐸̅) được gọi là 4 liên thông (hoặc 8 liên thông) nếu tồn tại một dãy các điểm gọi là đường đi
- (𝑖0, 𝑗0) = 𝐼𝑠 và (𝑖𝑛, 𝑗𝑛) = 𝐼𝑒
- (𝑖0, 𝑗0)→ (𝑖1, 𝑗1 →)… → (𝑖𝑛, 𝑗𝑛) mà (𝑖𝑘, 𝑗𝑘) ∈ E với mọi k=0,1,…,n
- (𝑖𝑘, 𝑗𝑘) là 4 láng giềng (hoặc 8 láng giềng) của (𝑖𝑘−1, 𝑗𝑘−1) với mọi k=1,2,…n
4 láng giềng và 8 láng giềng: Nếu (m, n) là một điểm ảnh thì 4 láng giềng của
nó là các điểm ngay bên trên, dưới, phải và trái.[3] Kí hiệu 𝑁4 là tập 4 láng giềng của điểm (m,n) và 𝑁8 là tập 8 láng giềng của điểm (m,n)
Trang 15𝑔 𝑖=0
Ta được: 𝜃 = argmax f(g) với 0 < g < G-1 là ngưỡng của ảnh cần tìm
Biên (đường bao của ảnh): là tập hợp các điểm biên.[3] Một điểm ảnh có thể
coi là điểm biên nếu có sự thay đổi đột ngột và mức xám hay biên là điểm có cấp xám
có giá trị khác hẳn các điểm xung quanh
1.3 Công nghệ Tesseract OCR
Nhận dạng kí tự quang học (Optical Character Recognition) là kỹ thuật được sử dụng để chuyển đổi ảnh văn bản sang dạng văn bản có thể chỉnh sửa trong máy tính Đầu vào của quá trình này là tập tin hình ảnh và đầu ra sẽ là các tập tin văn bản chứa nội dung là các chữ viết, kí hiệu có trong hình ảnh đó.[2]
Đối với các ngôn ngữ khác nhau, độ chính xác của Tesseract có sự khác biệt, được thể hiện ở bảng sau:
Bảng 1.1 Độ chính xác của Tesseract giữa các ngôn ngữ
Ngôn ngữ Tổng số kí tự
(triệu)
Tổng số từ (triệu) Lỗi kí tự (%) Lỗi từ (%)
Trang 16từ HP nên Tesseract nhận đầu vào là một ảnh nhị phân với các vùng đa giác tùy chọn
đã được xác định
Ban đầu, Tesseract được thiết kế làm việc trên ảnh nhị phân sau đó chương trình được cải tiến để có thể nhận dạng cả ảnh màu và ảnh mức xám Chính vì thế mà cần bộ phận phân tích ngưỡng thích ứng để chuyển đổi ảnh màu, ảnh mức xám sang ảnh nhị phân
Các bước của quá trình nhận dạng:
+ Bước đầu tiên là phân tích các thành phần liên thông Kết quả của bước này là tạo ra các đường bao quanh các ký tự
+ Bước thứ hai là tìm hàng và tìm từ, kết quả là tạo ra các vùng bao quanh các hàng chữ và kí tự chứa trong cùng văn bản
+ Bước cuối sẽ là nhạn dạng từ Công đoạn nhận dạng từ sẽ được xử lý qua hai giai đoạn Giai đoạn đầu nhận dạng các từ theo lượt Các từ thỏa mãn yêu cầu sẽ được chuyển sang bộ phận loại thích ứng (adaptive classifier) để làm dữ liệu huấn luyện giúp làm khả năng nhận diện được chính xác hơn ở phần sau của trang Giai đoạn hai, toàn bộ trang sẽ được quét toàn bộ, các từ không được nhận diện chính xác ở giai đoạn đầu sẽ được nhận dạng lại lần nữa Cuối cùng bộ nhận diện sẽ tổng hợp lại các thông tin ở trên và cho ra kết quả nhận diện hoàn chỉnh
Trang 17Ứng dụng nhận dạng biển số xe là ứng dụng có khả năng phân tích hình ảnh và xác định biển số xe từ các hình ảnh chụp được từ các thiết bị thu hình Nguồn hình ảnh cho ứng dụng có rất nhiều và phát triển hơn là trực tiếp thu từ camera
Có nhiều cách thức khác nhau để phân loại các ứng dụng nhận dạng biển số xe Một trong những cách đơn giản là phân loại ứng dụng nhận dạng biển số xe thông qua mục đích sử dụng Có thể chia ứng dụng nhận dạng biển số xe thành hai loại sau:
Loại 2: Không giới hạn vùng nhìn
Đầu vào: ảnh đầu vào thu được từ thiết bị ghi hình tự động, không phụ thuộc vào góc độ, các đối tượng xung quanh, ảnh không cần bắt buộc chỉ chụp vùng chứa biển số xe, mà có thể là ảnh tổng hợp như chứa thêm các đối tượng như người, cây, đường phố…, miễn là vùng biển số phải đủ rõ để có thể nhận dạng được ký tự trong vùng đó
Nguyên lý hoạt động: do đặc tính không giới hạn vùng nhìn mà ảnh đầu vào có thể thu được từ một thiết bị ghi hình (camera, máy ảnh) Và do đó, công việc đầu tiên
là dò tìm trong ảnh, để xác định đúng vùng nào là biển số xe Sau đó, thực hiện tách vùng và nhận dạng Cuối cùng tùy thuộc vào mục đích sử dụng ma kết quả nhận dạng được truyền đi hay lưu trữ để phục vụ nhu cầu của người dùng cuối
Ứng dụng: vì không phụ thuộc vào phạm hình ảnh thu được nên có dùng ứng dụng tại nhiều nơi như tại những điểm điều tiết giao thông, tại các vị trí nhạy cảm của giao thông như ngã ba, ngã tư đường giao nhau Kiểm soát, phát hiện những hành vi vi phạm an toàn giao thông
Yêu cầu thiết bị:
+ Máy quét
Trang 18Kiểm soát xe tại các đường biên giới: Mỗi quốc gia đề có những quy định riêng
về biển số xe, để phục vụ cho công tác quản lý và phát hiện những phương tiện giao thông vượt biên bất hợp phá Việc lắp đặt hệ thống nhận dạng biển số xe tại các trạm kiểm soát sẽ góp phần hỗ trợ công tác kiểm tra và an ninh quốc gia
Các trạm gác cổng: Việc lắp đặt hệ thống sẽ hỗ trợ hoặc tự động hóa công tác
mở cổng cho xe ra vào
Xử lý vi phạm giao thông: Khi lắp đặt hệ thống sẽ hỗ trợ việc xử lý vi phạm giao thông đường bộ và có thể tự động báo lỗi vi phạm Hiện đang được thí điểm trên một số tuyến đường cúa Quốc lộ 1A để xử lý lỗi chạy quá tốc độ
Ngoài ra, hệ thống còn được ứng dụng vào công tác chống trộm xe, các bãi giữ
xe tự động, điều tiết giao thông,…
2.1.2 Phân loại biển số xe
Quy định biển số của 63 tỉnh thành (Biển đen chữ trắng)
Trang 192.1.3 Những quy định về màu sắc và chữ số đặc biệt
- Màu xanh chữ trắng là biển xe của các cơ quan hành chính sự nghiệp:
+ Trực thuộc chính phủ là biển xanh 80
+ Trực thuộc tỉnh thành thì theo số tương ứng
- Màu đỏ chữ trắng là biển xe trong quân đội:
+ AT: Binh đoàn 12
+ AD: Quân Đoàn 4, Binh đoàn cửu long
+ BB: bộ binh
+ BC: Binh chủng Công Binh
+ BH: Binh chủng hoá học
+ BS: Binh đoàn Trường Sơn
+ BT: Binh chủng thông tin liên lạc
+ QH: Quân chủng hải quân
+ QK, QP: Quân chủng phòng không không quân
+ TC: Tổng cục chính trị
+ TH: Tổng cục hậu cần
Trang 20+ Viện kiểm soát nhân dân tối cao
+ Tòa án nhân dân tối cao
+ Đài truyền hình Việt Nam
+ Đài tiếng nói Việt Nam
+ Thông tấn xã Việt Nam
+ Báo nhân dân
+ Thanh tra Nhà nước
+ Học viện Chính trị quốc gia
+ Ban quản lý Lăng, Bảo tàng, khu di tích lịch sử Hồ Chí Minh
+ Trung tâm lưu trữ quốc gia
+ Ủy ban Dân số kế hoạch hóa gia đình
+ Tổng công ty Dầu khí Việt Nam
+ Các đại sứ quán, tổ chức quốc tế và nhân viên người nước ngoài
+ Ủy ban Chứng khoán nhà nước
+ Cục hàng không dân dụng Viết Nam
+ Kiểm toán nhà nước