Xỏc định chớnh xỏc vựng chứa biển số xe

Một phần của tài liệu Luận văn: TÌM HIỂU BÀI TOÁN NHẬN DẠNG BIỂN SỐ XE pdf (Trang 35 - 61)

2. Cho điểm của cỏn bộ phản biện

2.3. Xỏc định chớnh xỏc vựng chứa biển số xe

Kết quả của bài toỏn trờn đưa ra tập cỏc vựng con Ic cú khả năng chứa biển số xẹ Cỏc vựng con này là cỏc tứ giỏc. Tuy nhiờn, số lượng cỏc vựn con Ic là khỏc nhiều, chưa thể đảm bảo chớnh xỏc vựng nào chứa biển số xe để thực hiện việc cuối cựng là nhận dạng ảnh. Vỡ vậy, phải loại bỏ đi những vựng con trong Ic khụng cú khả năng chứa biến số xẹ

Sơ đồ thực hiện bài toỏn này:

Vựng con Ic

Bước ban đầu

Tiờu chớ về chiều rộng và cao

Tiờu chớ số ký tự

Vựng con Ib

2.3.1. Bƣớc ban đầu:

Ta biết: Biển số xe trờn thực tế cú hỡnh dạng là hỡnh chữ nhật. Vỡ vậy, khi chụp ảnh của biển số xe sẽ cú dạng tựa hỡnh bỡnh hành. Trường hợp tối ưu là ảnh hỡnh chữ nhật. Do đú, trong quỏ trỡnh xột duyệt cỏc vựng con Ic, nếu hỡnh nào khụng cú hỡnh dạng tựa hỡnh bỡnh hành thỡ cú thể loại bỏ ngay mà khụng cần tớnh đến. Ta cú thể xem hỡnh tứ giỏc tựa hỡnh bỡnh hành cú những đặc điểm sau:

Cỏc gúc khụng cú nhỏ. Cú thể lấy ngưỡng là 0 45

Hai gúc đối khụng chờnh lệch quỏ lớn. Lấy ngưỡng 0 30

Biến số xe phải cú một diện tớch nào đú, và đủ lớn để cú thể nhận diện ra ký tự tồn tại trờn đú. Vỡ vậy, những vựng con cú diện tớch nhỏ hơn một ngưỡng nào đú, thỡ loại bỏ ngay và chỳ ý kớch thước chiều dài và rộng của vựng con

i c

I . Vậy thỡ chu vi của vựng con nhỏ hơn ngưỡng nào đú thỡ cú thể loại bỏ ngay Void Filter

{

// Đầu vào là tập vựng con Ic // Đầu ra: tập vựng con '

c

I

// là ngưỡng về chu vi

// Perimeter(Ici) là chu vi của mỗi vựng con Ic // N là số vựng con

For(int i=0; i< N; i++){ If(Perimeter(

i c

I ) > )

// Caclulate goc A,B,C,D của mỗi vựng con

i c

I

If( A && B && C && D thỏa món ngưỡng) Copy( ' i c I , Ici) } }

Sau khi loại bỏ đi những vựng con theo hai tiờu chớ trờn, chỳng ta thu được tập con '

c

I . Vỡ thực tế biển số xe cú hỡnh chữ nhật, nờn ta cú thể dựng phộp tịnh tiến, phộp quay, phộp tỷ lệ để đưa cỏc vựng con '

c

Lý do để đưa cỏc hỡnh tứ giỏc thành hỡnh chữ nhật vỡ biển số xe cú dạng hỡnh chữ nhật, cỏc ký tự nằm trong vựng biển số xe vuụng gúc với cạnh dài của hỡnh chữ nhật. Khi thu được ảnh, cú nhiều nguyờn nhõn làm cho ảnh biển số xe bị nghiờng. Kộo theo đú, cỏc ký tự cũng bị nghiờng theo, làm cho việc nhận dạng trở nờn khụng chớnh xỏc. Việc nắn tứ giỏc trở lại thành hỡnh chữ nhật và cũng nắn cỏc ký tự trở nờn thành đứng. Và khi trở thành hỡnh dạng chữ nhật, thỡ biển số xe mới thể hiện rừ tớnh tỷ lện chiều dài/rộng. Và ta cú cỏc tiờu chớ dưới đõỵ

2.4.2 Tiờu chớ tỷ lệ chiều dài/rộng.

Với mỗi quốc gia, thỡ biển số xe cú kớch thước nhất định. Và thể hiện thụng qua tỷ lệ giữa cỏc cạnh. Vớ dụ với biển số xe ở nước ta: với biển số cú một hàng thỡ tỷ lệ nằm trong khoảng 3.5 W H 4.5 và với biển số xe cú hai hàng thỡ tỷ lệ là 0.8 W H 1.4. Và kết quả của tiờu chớ tỷ lệ chiều dài/rộng là thu được một tập con của '

c

I chứa biển số xẹ Vậy ta cú giải thuật Void RatioWH

{

// Đầu vào là tập con '

c I // Đầu ra là tập con '' c I của ' c I

// Gọi edge_ratio= tỷ lệ chiều dài/rộng // là ngưỡng chiều dài/rộng [0.8,4.5] For(int i=0;i< N;i++)

{ Int m= edge_ratio( ' i c I ) If(m [0.8,4.5] ) Copy( '' i c I , ' i c I ) } } Kết quả: tập cỏc vựng con '' i c

I cú khả năng chứa biển số xẹ Với số vựng con nhỏ hơn hẳn số vựng con ma ta thu được ban đầu trong biển đổi Hough.

2.4.3 Tiờu chớ số ký tự trong vựng biển số xe

Với mỗi nước thỡ số ký tự trong biển là khỏc nhaụ Ở nước ta, số ký tự trong biển số xe thường là 6,7,8 tương ứng đối với cỏc xe quõn đội, xe mỏy cũ và xe ụ tụ, đối với xe mỏy bõy giờ.

Mỗi ký tự cú cỏc đặc trưng sau:

85 . 0 33 . 0 Height 22 . 0 Width Từ đú ta cú ngưỡng sử dụng là [6,8] Void Character {

// Đầu vào tập vựng con ''

i c I // Đầu ra tập vựng con ''' i c I // N là tổng số vựng con của '' i c I

For(int i= 0; i< N; i++) {

Với mỗi vựng con ''

i c

I

- Tỡm vựng liờn thụng của mỗi ''

i c

I

- Lưu cỏc thụng số về chiều rộng, cao của mỗi vựng liờn thụng If(thỏa món ngưỡng ) thỡ tiến hành nhận dạng

} }

Kết quả nếu tỡm được biển số xe đầu tiờn thỏa món, chỳng ta cú thể dừng thuật toỏn ngay và chuyển sang bước 3 là nhận dạng ký tự. Nếu tỡm tất cả cỏc biển số xe tồn tại trong ảnh, thỡ bắt buộc phải duyệt qua toàn bộ vựng ảnh.

Chƣơng 3:

BÀI TOÁN NHẬN DẠNG Kí TỰ 3.1 Tổng quan về nhận dạng

Nhận dạng là quỏ trỡnh phõn loại cỏc đối tượng được biểu diễn theo một mụ hỡnh nào đú và gỏn cho chỳng vào một lớp (gỏn cho đối tượng một tờn gọi) dựa theo những quy luật và cỏc mẫu chuẩn. Quỏ trỡnh nhận dạng dựa vào những mẫu học biết trước gọi là nhận dạng cú thày hay học cú thày (supervised learning); trong trường hợp ngược lại gọi là học khụng cú thày (non supervised learning). Chỳng ta sẽ lần lượt giới thiệu cỏc khỏi niệm nàỵ

3.1.1 Khụng gian biểu diễn đối tƣợng, khụng gian diễn dịch

*)Khụng gian biểu diễn đối tượng

Cỏc đối tượng khi quan sỏt hay thu thập được, thường được biểu diễn bởi tập cỏc đặc trưng hay đặc tớnh. Người ta thường phõn cỏc đặc trưng theo cỏc loại như: đặc trưng tụ pụ, đặc trưng hỡnh học và đặc trưng chức năng. Việc biểu diễn ảnh theo đặc trưng nào là phụ thuộc vào ứng dụng tiếp theọ

Ở đõy ta đưa ra một cỏch hỡnh thức việc biểu diễn cỏc đối tượng. Giả sử đối tượng X (ảnh, chữ viết, dấu võn tay, v...,v) được biểu diễn bởi n thành phần (n đặc trưng): X = {x1, x2,..., xn}; mỗi xi biểu diễn một đặc tớnh. Khụng gian biểu diễn đối tượng thường gọi tắt là khụng gian đối tượng X được định nghĩa:

X = {X1, X2,..., Xm}

trong đú mỗi Xi biểu diễn một đối tượng. Khụng gian này cú thể là vụ hạn. Để tiện xem xột chỳng ta chỉ xột tập X là hữu hạn.

*)Khụng gian diễn dịch

Khụng gian diễn dịch là tập cỏc tờn gọi của đối tượng. Kết thỳc quỏ trỡnh nhận dạng ta xỏc định được tờn gọi cho cỏc đối tượng trong tập khụng gian đối tượng hay núi là đó nhận dạng được đối tượng Một cỏch hỡnh thức gọi là tập tờn đối tượng:

Quỏ trỡnh nhận dạng đối tượng f là một ỏnh xạ f: X ---> với f là tập cỏc quy luật để xỏc định một phần tử trong X ứng với một phần tử trong . Nếu tập cỏc quy luật và tập tờn cỏc đối tượng là biết trước như trong nhận dạng chữ viết (cú 26 lớp từ A đến Z), người ta gọi là nhận dạng cú thàỵ Trường hợp thứ hai là nhận dạng khụng cú thàỵ Đương nhiờn trong trường hợp này việc nhận dạng cú khú khăn hơn.

3.1.2 Mụ hỡnh và bản chất của quỏ trỡnh nhận dạng

3.1.2.1 Mụ hỡnh

Việc chọn lựa một quỏ trỡnh nhận dạng cú liờn quan mật thiết đến kiểu mụ tả mà người ta sử dụng để đặc tả đối tượng. Trong nhận dạng, người ta phõn chia làm 2 họ lớn:

- Họ mụ tả theo tham số - Họ mụ tả theo cấu trỳc.

Cỏch mụ tả được lựa chọn sẽ xỏc định mụ hỡnh của đối tượng. Như vậy, chỳng ta sẽ cú 2 loại mụ hỡnh: mụ hỡnh theo tham số và mụ hỡnh cấu trỳc.

Mụ hỡnh tham số: sử dụng một vộctơ để đặc tả đối tượng. Mỗi phần tử của vộctơ mụ tả một đặc tớnh của đối tượng. Thớ dụ như trong cỏc đặc trưng chức năng, người ta sử dụng cỏc hàm cơ sở trực giao để biểu diễn. Và như vậy ảnh sẽ được biểu diễn bởi một chuỗi cỏc hàm trực giaọ Giả sử C là đường bao của ảnh và C(i,j) là điểm thứ i trờn đường bao, i = 1, 2,..., N (đường bao gồm N điểm). Giả sử tiếp : x0 = 1 1 N i N xi y0 = 1 1 N i N yi

là toạ độ tõm điểm. Như vậy, moment trung tõm bậc p, q của đường bao là: pq = 1 1 N i N (xi-x0)p(yi-y0)q (7.1)

Vộctơ tham số trong trường hợp này chớnh là cỏc moment ij với i=1, 2,...,p và j=1, 2,...,q. Cũn trong số cỏc đặc trưng hỡnh học, người ta hay sử dụng chu tuyến , đường bao, diện tớch và tỉ lệ T = 4 S/p2, với S là

diện tớch, p là chu tuyến.

Việc lựa chọn phương phỏp biểu diễn sẽ làm đơn giản cỏch xõy dựng. Tuy nhiờn, việc lựa chọn đặc trưng nào là hoàn toàn phụ thuộc vào ứng dụng. Thớ dụ , trong nhận dạng chữ (sẽ trỡnh bày sau), cỏc tham số là cỏc dấu hiệu:

- số điểm chạc ba, chạc tư, - số điểm chu trỡnh,

- số điểm ngoặt, - số điểm kết thỳc,

chẳng hạn với chữ t cú 4 điểm kết thỳc, 1 điểm chạc tư,...

Mụ hỡnh cấu trỳc:Cỏch tiếp cận của mụ hỡnh này dựa vào việc mụ tả đối tượng nhờ một số khỏi niệm biểu thị cỏc đối tượng cơ sở trong ngụn ngữ tự nhiờn. Để mụ tả đối tượng, người ta dựng một số dạng nguyờn thuỷ như đoạn thẳng, cung, v,...,v. Chẳng hạn một hỡnh chữ nhật được định nghĩa gồm 4 đoạn thẳng vuụng gúc với nhau từng đụi một. Trong mụ hỡnh này người ta sử dụng một bộ kớ hiệu kết thỳc Vt, một bộ kớ hiệu khụng kết thỳc gọi là Vn. Ngoài ra cú dựng một tập cỏc luật sản xuất để mụ tả cỏch xõy dựng cỏc đối tượng phự hợp dựa trờn cỏc đối tượng đơn giản hơn hoặc đối tượng nguyờn thuỷ (tập Vt). Trong cỏch tiếp cận này, ta chấp nhận một khẳng đinh là: cấu trỳc một dạng là kết quả của việc ỏp dụng luật sản xuất theo theo những nguyờn tắc xỏc định bắt đầu từ một dạng gốc ban đầụ Một cỏch hỡnh thức, ta cú thể coi mụ hỡnh này tương đương một văn phạm G = (Vt, Vn, P, S) với:

- Vt là bộ ký hiệu kết thỳc,

- Vn là bộ ký hiệu khụng kết thỳc, - P là luật sản xuất,

- S là dạng (ký hiệu bắt đầu).

3.1.2.2 Bản chất của quỏ trỡnh nhận dạng

Quỏ trỡnh nhận dạng gồm 3 giai đoạn chớnh: - Lựa chọn mụ hỡnh biểu diễn đối tượng.

- Lựa chọn luật ra quyết định (phương phỏp nhận dạng) và suy diễn quỏ trỡnh học.

- Học nhận dạng.

Khi mụ hỡnh biểu diễn đối tượng đó được xỏc định, cú thể là định lượng (mụ hỡnh tham số) hay định tớnh (mụ hỡnh cấu trỳc), quỏ trỡnh nhận dạng chuyển sang giai đoạn học. Học là giai đoạn rất quan trọng. Thao tỏc học nhằm cải thiện, điều chỉnh việc phõn hoạch tập đối tượng thành cỏc lớp.

Việc nhận dạng chớnh là tỡm ra quy luật và cỏc thuật toỏn để cú thể gỏn đối tượng vào một lớp hay núi một cỏch khỏc gỏn cho đối tượng một tờn.

*)Học cú thày (supervised learning)

Kỹ thuật phõn loại nhờ kiến thức biết trước gọi là học cú thàỵ Đặc điểm cơ bản của kỹ thuật này là người ta cú một thư viện cỏc mẫu chuẩn. Mẫu cần nhận dạng sẽ được đem sỏnh với mẫu chuẩn để xem nú thuộc loại nàọ Thớ dụ như trong một ảnh viễn thỏm, người ta muốn phõn biệt một cỏnh đồng lỳa, một cỏnh rừng hay một vựng đất hoang mà đó cú cỏc miờu tả về cỏc đối tượng đú. Vấn đề chủ yếu là thiết kế một hệ thống để cú thể đối sỏnh đối tượng trong ảnh với mẫu chuẩn và quyết định gỏn cho chỳng vào một lớp. Việc đối sỏnh nhờ vào cỏc thủ tục ra quyết định dựa trờn một cụng cụ gọi là hàm phõn lớp hay hàm ra quyết định. Hàm này sẽ được đề cập trong phần saụ

*)Học khụng cú thày(unsupervised learning)

Kỹ thuật học này phải tự định ra cỏc lớp khỏc nhau và xỏc định cỏc tham số đặc trưng cho từng lớp. Học khụng cú thày đương nhiờn là khú khăn hơn. Một mặt, do số lớp khụng được biết trước, mặt khỏc những đặc trưng của cỏc lớp cũng khụng biết trước. Kỹ thuật này nhằm tiến hành mọi cỏch gộp nhúm cú thể và chọn lựa cỏch tốt nhất. Bắt đầu từ tập dữ liệu, nhiều thủ tục xử lý khỏc nhau nhằm phõn lớp và nõng cấp dần để đạt được một phương ỏn phõn loạị

Nhỡn chung, dự là mụ hỡnh nào và kỹ thuật nhận dạng ra sao, một hệ thống nhận dạng cú thể túm tắt theo sơ đồ sau:

Hỡnh 3.1: Sơ đồ tổng quỏt một hệ nhận dạng. 3.2 Mụ hỡnh mạng nơron nhõn tạo

Mạng nơron nhõn tạo (Artificial Neural Network) bao gồm cỏc nỳt (đơn vị xử lý) được nối với nhau bởi cỏc liờn kết nơron. Mỗi liờn kết kốm theo một trọng số nào đú, đặc trưng cho đặc tớnh kớch hoạt giữa cỏc nơron. Cú thể xem trọng số là phương tiện để lưu giữa thụng tin dài hạn trong mạng và nhiệm vụ của quỏ trỡnh huấn luyện (học) mạng là cập nhật cỏc trọng số khi cú them cỏc thụng tin về cỏc mẫu học, hay núi cỏch khỏc, cỏc trọng số được điều chỉnh sao cho đỳng.

Trong mạng, một số nơron được nối với mụi trường bờn ngoài như cỏc đầu ra, đầu vào

3.2.1 Mụ hỡnh nơron nhõn tạo Hỡnh 3.2: Mụ hỡnh nơron nhõn tạo Trớch chọn đặc tớnh biểu diễn đối t ƣợng Phõn lớp ra quyết định Đỏnh giỏ Quỏ trỡnh ti ền xử lý Khối nhận dạng

Mỗi nơron được nối với cỏc nơron khỏc và nhận được cỏc tớn hiệu sj từ chỳng với cỏc trọng số wj. Tổng cỏc thụng tin vũa cú trọng số là:

Người ta gọi đõy là thành phần tuyến tớnh của nơron. Hàm kớch hoạt g (cũn gọi là hàm chuyển). Đúng vai trũ biến đổi từ Net sang tớn hiệu đầu ra out.

Đõy là thành phần phi tuyến của nơron. Cú 3 dạng hàm kớch hoạt thường được dựng trong thực tế *)Hàm dạng bước: 0 0 0 1 x x x step x x x step 0 1 *)Hàm dấu: 0 1 0 1 x x x step x x x step 1 1 *)Hàm sigmoid: x e x Sigmoid 1 1 ) (

Ở đõy ngưỡng đúng vai trũ làm tăng tớnh thớch nghi và khả năng tớnh toỏn của mạng nơron. Sử dụng ký phỏp vộctơ, S s1,....,sn vộctơ tớn hiệu vào,

n w w W 1,...., vecto trọng số, ta cú Net g out Net SW

Trường hợp xột ngưỡng , ta dựng biểu diễn vecto mới S s1,....,sn, ,

1 , ,...., 1 ' n w w W 3.2.2 Mạng Nơron

Mạng nơron là hệ thống bao gồm nhiều phần tử xử lý đơn giản (nơron) hoạt động song song. Tớnh năng của hệ thống này tựy thuộc vào cấu trỳc của hệ, cỏc trọng số liờn kết nơron và quỏ trỡnh toỏn tại cỏc nơron đơn lẻ. Mạng nơron cú thể học từ dữ liệu mẫu và tổng quỏt húa dựa trờn cỏc dựa trờn cỏc dữ liệu mẫu

Net= wjsj

học. Trong mạng nơron, cỏc nơron đún nhận tớn hiệu vào gọi là nơron vào và cỏc nơron đưa thụng tin ra gọi là nơron rạ

3.2.2.1 Phõn loại cỏc mạng noron

Theo kiểu liờn kết nơron: ta cú mạng nơron truyền thẳng (feel- forward Neural Network) và mạng nơron qui hồi (recurrent Neural Network). Trong mạng nơron truyền thẳng, cỏc liờn kết nơron đi theo một hướng nhất định, khụng tạo thành đồ thị khụng cú chu trỡnh với cỏc đỉnh là cỏc nơron, cỏc cung là cỏc liờn kết giữa chỳng. Ngược lại, cỏc mạng qui hồi cho phộp cỏc liờn kết nơron tạo thành chu trỡnh. Vỡ cỏc thụng tin ra của cỏc nơron được truyền lại cho cỏc nơron đó gúp phần kớch hoạt chỳng, nờn mạng hồi quy cũn cú khả năng

Một phần của tài liệu Luận văn: TÌM HIỂU BÀI TOÁN NHẬN DẠNG BIỂN SỐ XE pdf (Trang 35 - 61)

Tải bản đầy đủ (PDF)

(61 trang)