Tóm tắt luận vănLuận văn được trình bày bằng 5 chương hướng vào hai phần chính : phầnnhận dạng hình học và phần ứng dụng của nó là xây dựng hệ thống nhận dạngbiển số xe.. Nội dung của ch
Nhận dạng vân tay (Fingerprint Recognition)
• Dựa vào sự khác nhau đặc trưng về vân tay của từng người.
• Nguyên lý hoạt động và thuật toán
Hình 1.2 - Quy trình nhận dạng vân tay.
• Đánh giá Các nhà khoa học đã tìm thấy rằng các thành viên gia đình thường chia sẻ các mô hình dấu vân tay cùng chung, dẫn đến niềm tin rằng những mô hình được thừa hưởng
• Tình hình phát triển và ứng dụng Nhận dạng vân tay là một trong những công nghệ được ứng dụng rộng rãi từ rất lâu trên thế giới.
Nhận dạng tròng mắt (Iris Recognition)
• Sau nhận dạng vân tay là nhân dạng tròng mắt được phát triển khá lâu.
Với ý nghĩa sinh trắc học tương tự, nhưng kỹ thuật thực hiện khác nhau, nhận diện vân tay là so khớp mẫu, nhận dạng tròng mắt là mã hóa.
• Nguyên lý hoạt động và thuật toán
Hình 1.3 - Quy trình nhận dạng tròng mắt.
– Tròng đen của mắt một cơ quan nội tạng được bảo vệ tốt chống lại thiệt hại.
– Mống mắt có một kết cấu tốt mà giống như dấu vân tay, khác biệt từng người là rất lớn.
– Dễ bị lừa bởi một hình ảnh mống mắt giả.
– Các máy quét khó để điều chỉnh cho nhiều người độ cao khác nhau.
– Máy quét mống mắt có nhiều tốn kém hơn so với một số các hình thức sinh trắc học, mật khẩu khác.
– Như với các công nghệ sinh trắc học hình ảnh khác, nhận dạng mống mắt là dễ bị chất lượng hình ảnh kém làm mất chính xác.
– Tiêu thụ rượu gây ra suy thoái được công nhận là nguyên nhân làm giãn, co thắt gây ra biến dạng trong mống mắt mẫu.
• Tình hình phát triển và ứng dụng
– Vương Quốc Ả Rập Thống Nhất (UAE) đã dùng hệ thống nhận dạng tròng mắt để quản lý thị thực.
– Ấn Độ có dự án nhận dạng mống mắt cho cơ sở dữ liệu một tỷ người dân.
– Nhận dạng tròng mắt là một trong ba công nghệ nhận dạng sinh trắc học tiêu chuẩn quốc tế của ICAO để sử dụng trong hộ chiếu tương lai(hai công nghệ khác là dấu vân tay và nhận dạng khuôn mặt).
– Công nghệ nhận dạng mống mắt đã được thực hiện bởi BioID Tech- nologies SA trong Pakistan cho dự án hồi hương UNHCR để kiểm soát phân phối viện trợ cho người tị nạn Afghanistan.
– Tại Sân bay Schiphol Hà Lan nhận dạng mống mắt đã cho phép nhập cư hộ chiếu miễn phí từ năm 2001.
– Vào ngày 10 Tháng 5 năm 2011, công ty Hoyos đưa ra một thiết bị được gọi là EyeLock sử dụng nhận dạng tròng mắt là một thay thế cho mật khẩu để đăng nhập người vào các trang web bảo vệ mật khẩu và các ứng dụng, như Facebook hay eBay.
Nhận dạng khuôn mặt (Face Recognition)
So với phương pháp nhận dạng vân tay và tròng mắt, mặc dù nhận dạng khuôn mặt dễ thực hiện hơn nhưng mức độ bảo mật lại không cao bằng Nhờ tính dễ sử dụng, phương pháp này đặc biệt thích hợp với các ứng dụng quản lý công cộng, nơi cần đảm bảo tính tiện lợi và nhanh chóng cho người dùng.
• Nguyên lý hoạt động và thuật toán
Hình 1.4 - Hệ thống nhận dạng khuôn mặt.
– Nhận dạng khuôn mặt có thể không đáng tin cậy nhất và hiệu quả so với một số công nghệ khác Tuy nhiên, một trong những lợi thế quan trọng là nó không yêu cầu sự hợp tác (hoặc sự đồng ý) từ các đối tượng thử nghiệm Các công nghệ nhận dạng sinh trắc học khác như dấu vân tay, mống mắt quét và nhận dạng giọng nói không thể thực hiện hình thức này.
– Nhận dạng khuôn mặt khó thực hiện trong một số điều kiện nhất định.
– Các điều kiện khiến nhận dạng khuôn mặt không làm việc tốt bao gồm ánh sáng kém, kính mát, mái tóc dài, hoặc các đối tượng khác che một phần khuôn mặt của đối tượng, và hình ảnh độ phân giải thấp.
Một hạn chế đáng kể là hệ thống nhận dạng khuôn mặt thường hoạt động không hiệu quả khi biểu cảm khuôn mặt thay đổi Ngay cả một nụ cười rộng cũng có thể dẫn đến nhận dạng sai đối tượng.
• Tình hình phát triển và ứng dụng
– Cảnh sát liên bang Đức sử dụng một hệ thống nhận dạng khuôn mặt để kiểm soát biên giới hoàn toàn tự động ở Frankfurt
– Hải quan Úc có một hệ thống xử lý biên giới tự động gọi là SmartGate.
– Bộ Ngoại giao Mỹ điều hành một trong các hệ thống nhận dạng khuôn mặt lớn nhất thế giới với hơn 75 triệu hình ảnh được sử dụng tích cực trong quá trình xử lý thị thực.
– Trong cuộc bầu cử tổng thống năm 2000, chính phủ Mexico sử dụng phần mềm nhận dạng khuôn mặt để ngăn chặn gian lận bầu cử.
– Công nghệ này có thể được sử dụng như một biện pháp an ninh tại máy ATM.
– Hệ thống nhận dạng khuôn mặt cũng bắt đầu được đưa vào mở khóa thiết bị di động, đăng nhập trực tuyến, trong hệ điều hành Android, iOS.
– Hệ thống nhận dạng khuôn mặt được tích hợp trong hầu hết các model máy ảnh của các hãng công nghệ hàng đầu như Sony, Canon.
– Chương trình nhận dạng thế hệ mới NGI của chính phủ Mỹ với dữ liệu hàng triệu công dân Mỹ và thế giới đang dấy lên tranh cãi về sự xâm phạm riêng tư.
– Nhận dạng khuôn mặt góp phần lớn trong việc nhận dạng hung thủ của vụ khủng bố Boston.
– Hãng xe hơi Nissan đã tạo ra hệ thống nhận dạng khuôn mặt tài xế để cảnh báo tình trạng say xỉn hoặc mất tập trung.
– Hãng xe hơi BMW đang phát triển hệ thống nhận dạng phân tích khuôn mặt người lái xe điều chỉnh các thông số trong xe tạo sự tiện nghi thoả mái cho người lái.
Nhận dạng tĩnh mạch bàn tay (Fingerprint Vein Recogni- tion)
• Là kỹ thuật nhận dạng mới phát triển gần đây, với nhiều ưu điểm mà ba kỹ thuật trên không có được.
• Nguyên lý hoạt động và thuật toán
Hình 1.5 - Hệ thống nhận dạng tĩnh mạch bàn tay.
– Không tiếp xúc – Chính xác cao – Có giá trị lâu dài vì cấu trúc mạch máu không đổi + Thiếu sót :
• Tình hình phát triển và ứng dụng
– "Phòng Thí Nghiệm của công ty Fujitsu, Fujitsu Laboratories, vừa thông báo họ đã đạt được những tiến triển đáng kể trong việc phát triển cảm biến nhận dạng tĩnh mạch lòng bàn tay mỏng và nhẹ nhất thế giới Bằng cách thiết kế lại hoàn toàn hệ thống quang học với các cảm biến hình ảnh mới và thành phần quang học khác, Fujitsu Lab- oratories đã thành công trong việc thu nhỏ độ dày của cảm biến mới xuống còn 5mm và thể tích cũng giảm đi 80% so với thế hệ trước.".
Nhu cầu thực tế và khả năng phát triển về nhận dạng hình ảnh 7
Nhu cầu
• Nhu cầu về đảm bảo an ninh
• Nhu cầu về đảm bảo giao thông
• Nhu cầu về tự động hóa, số hóa, cắt giảm chi phí.
• Nhu cầu sản xuất sản phẩm công nghệ cao cho cuộc sống tiện nghi
• Nhu cầu tăng chất lượng phục vụ đám đông Nhận dạng hình ảnh có nhu cầu thực tế rất lớn :
• Kiểm soát an ninh ở các địa điểm công cộng : nhà ga , sân bay, siêu thị, cơ quan nhà máy
• Quản lý phương tiện giao thông.
• Là bộ phận không thể thiếu trong công nghệ robot, phương tiện tự hành, không người lái.
• Nhu cầu trong giáo dục, giảng dạy bằng hình ảnh, giảng dạy cho người khuyết tật.
• Số hóa, quản lý tài liệu ứng dụng trong thư viện số, cơ quan lưu trữ tài liệu.
• Nhu cầu rộng rãi trong các thiết bị hình ảnh công nghệ cao, các tiện ích quay phim chụp ảnh, điều khiển thông qua hình ảnh.
• Nhu cầu trong kinh doanh điều tra thị hiếu, điều tra xã hội,
• Nhu cầu trong công cụ tìm kiếm, mạng xã hội,
Khả năng phát triển
• Trước đây công nghệ nhận dạng chủ yếu được ứng dụng trong lĩnh vực an ninh bởi các lý do:
– Hệ thống phức tạp, chi phí cao do các thiết bị điện tử cồng kềnh tinh vi
– Tốc độ chậm, thiếu yếu tố thời gian thực bởi tốc độ xử lý chậm.
• Ngày nay với sự phát triển nhanh chóng của tốc độ máy tính và thiết bị cảm biến hình ảnh Với thuật toán cài đặt thích hợp dễ dàng tạo ra được hệ thống nhận dạng với độ chính xác và tốc độ chấp nhận được.
• Một số công nghệ nhận dạng hình ảnh có thể phát triển trong tương lai :như nhận dạng vành tai, nhận dạng nụ cười, nhận dạng cảm xúc
Các ví dụ thực tế về nhận dạng biển số xe
Hệ thống nhận dạng biển số xe tự động (ANPR)
ANPR được phát minh vào năm 1976 tại cơ quan phát triển khoa học của cảnh sát Anh quốc Hệ thống nguyên mẫu đã được làm việc vào năm 1979, và hợp đồng đã được cho phép để sản xuất các hệ thống công nghiệp, đầu tiên tại công ty điện tử EMI, và sau đó là hệ thống nhận dạng máy tính (CRS) ở Wokingham , Vương quốc Anh Hệ thống thử nghiệm đầu tiên đã được triển khai trên các đường A1 và tại hầm Dartford Việc bắt giữ đầu tiên thông qua phát hiện của một chiếc xe bị đánh cắp đã được thực hiện trong năm 1981 Đến nay các ứng dụng của ANPR đã được ứng dụng rộng rãi ở các nước trên thế giới Tuy nhiên độ chính xác, phạm vi ứng dụng, chi phí hệ thống vẫn được tiếp tục nghiên cứu cải tiến bởi nguyên nhân xuất phát từ một số khó khăn.
Có một số khó khăn bao gồm:
• Độ phân giải hình ảnh thấp, thường vì tấm hình quá xa nhưng đôi khi do việc sử dụng của một máy ảnh chất lượng thấp.
• Mờ hình ảnh, đặc biệt là chuyển động mờ.
• Ánh sáng kém và độ tương phản thấp do tiếp xúc quá nhiều, phản ánh hoặc bóng tối.
• Biển số bị che khuất, hoặc bụi bẩn.
• Một phông chữ khác nhau, phổ biến cho bảng số màu mè (một số quốc gia không cho phép các tấm như vậy, loại trừ vấn đề).
• Thiếu sự phối hợp giữa các quốc gia hoặc tiểu bang Hai xe ô tô từ các nước khác nhau hoặc các quốc gia có thể có cùng một số nhưng thiết kế khác nhau của bảng số.
Một số ví dụ ở Việt Nam
Nước ta gần đây cũng đã xuất hiện các hệ thống nhận dạng biển số xe cài đặt cho đặc trưng của Việt Nam, đạt được kết quả khả quan:
Hệ thống ANPR của công ty Biển Bạc.
Hình 1.6 - Hệ thống nhận dạng biển số xe của công ty Biển Bạc.
• Phần mềm quản lý bãi đỗ xe thông minh Smart Parking.
• Phần mềm nhận dạng biển số xe cho trạm cân LPRSCALE
• Phần mềm phát hiện vi phạm giao thông STM01Hệ thống ANPR của công ty Mắt Thần.
Hình 1.7 - Hệ thống nhận dạng biển số xe của công ty Mắt Thần.
Hệ thống ANPR của công ty Tiền Phong.
Hệ thống ANPR tại bãi xe trường ĐHBK tp Hồ Chí Minh.
Khả năng mở rộng trong các điều kiện và ứng dụng khác
Hình 1.8 - Ngôn ngữ bàn tay.
+ Nhận dạng các hình học cơ bản cho giáo dục thiếu nhi + Nhận dạng mã số thuế, bill, số thuê bao
Hình 1.9 - Quét mã thuế Hình 1.10 - Tìm hình.
+ Đếm hồng cầu, lõi cáp quang.
Hình 1.11 - Đếm lõi cáp quang Hình 1.12 - Đếm số lượng hồng cầu.
Kiến thức tổng quát về xử lý ảnh
Kiến thức về ảnh và xử lý ảnh số
Hệ thống xử lý ảnh số
Hình 2.1 - Sơ đồ hệ thống xử lý ảnh.
• Bộ phận thu nhận ảnh :
– Chuyển đổi tín hiệu quang thành tín hiệu điện.
– Độ sáng của từng điểm trên vật thể thành giá trị số.
Hình 2.2 - Bộ phận thu nhận ảnh.
– Bộ vi xử lý hay máy tính điện tử.
– Thuật toán và chương trình thao tác trên cơ sở dữ liệu.
Hình 2.3 - Bộ phận xử lý ảnh
– Xuất thông tin thu từ ảnh – Xuất ảnh đầu ra qua các bộ phận hiển thị : máy in, màn hình,
Hình 2.4 - Bộ phận xuất kết quả.
Khái niệm về ảnh số
– Chia mỗi vật thể ra thành rất nhiều điểm, số điểm càng lớn thì tập hợp các điểm đó càng thể hiện chính xác vật thể Nếu tọa độ hóa bởi hệ trục Decarts thì mỗi điểm đó có một cặp tọa độ xác định.
– Độ sáng trên mỗi điểm của vật thể được chuyển đổi thành mức điện áp tương ứng qua bộ cảm biến ảnh của camera, các mức điện áp này được mã hóa thành giá trị số Việc chụp ảnh là sự chuyển từ không gian các điểm vật (với thuộc tính là độ sáng)thành không gian các điểm ảnh (pixel) (với đặc trưng là giá trị số).
– Ảnh là tập hợp tất cả các điểm ảnh Giả sử bức ảnh có chiều dài (tính theo điểm ảnh) là M điểm ảnh, chiều rộng là N điểm ảnh, thì bức ảnh có MxN điểm ảnh gọi là độ phân giải.
– Dưới dạng dữ liệu ảnh xám là một ma trận MxN với mỗi phần tử là giá trị sáng (mức xám) p(x,y) của điểm ảnh có tọa độ tương ứng (x=hàng, y=cột).
Hình 2.5 - Hệ tọa độ gắn bức ảnh.
– Mức xám của các điểm ảnh là giá trị biến thiên trong dải [0;1] gọi là dải xám.
Nếu dùng n bit để mã hóa mức xám của điểm ảnh thì dải xám là[0; 1] ∗ (2 n − 1)
252 252 254 253 252 250 250 249 249 218 199 222 255 255 250 239 168 150 170 193 33 107 94 40 66 252 223 81 164 152 155 141 108 187 140 98 41 95 252 5 69 89 159 119 191 165 129 173 108 247 122 253 2 171 127 67 8 103 90 91 69 147 248 250 254 41 253 140 166 88 251 251 252 249 54 216 253 201 78 253 53 254 249 76 254 249 254 212 168 252 254 254 253 123 253 255 228 80 255 254 254 43 25 254 254 255 223 241 254 255 255 254 254 254 254 Hình 2.6 - Ảnh xám Hình 2.7 - Ma trận điểm ảnh.
• Ảnh nhị phân : Là ảnh xám với giá trị xám chỉ 0 hoặc 1, dải xám {0,1}
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 1 0 0 1 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 1 0 0 0 1 1 1 1 0 1 1 1 1 1 0 1 0 1 1 0 1 1 1 1 0 1 1 1 1 1 1 0 1 1 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Hình 2.8 - Ảnh nhị phân Hình 2.9 - Ma trận điểm ảnh.
• Ảnh màu (RGB) : Là ảnh tổng hợp gồm ba ảnh xám với ba nền màu tương ứng là R, G và B Để chuyển ảnh màu RGB sang ảnh xám ta dùng công thức
Công thức chuyển đổi từ ảnh màu RGB sang ảnh xám Y :
Khái niệm về xử lý ảnh số
Xử lý ảnh : là quá trình biến đổi ảnh ban đầu thành một kết quả đầu ra mong muốn Được thực hiện dưới một tập các phép biến đổi toán học T.
• Phân loại theo mục đích :
– Nâng cao chất lượng ảnh : + Khử nhiễu :
∗ Khử nhiễu bằng lọc tuyến tính.
∗ Khử nhiễu bằng lọc phi tuyến.
∗ Khử nhiễu bằng bộ lọc thông.
I(x, y) → I(s) : I 0 (s) = I(s) ⊗ H(s) → I 0 (x, y) Ví dụ như lọc thông cao thông thấp, thông dải trong không gian tần số sau khi biến đổi Fourier.
+ Nội suy : Sử dụng các hàm nội suy toán học.
+ Phóng to thu nhỏ : Chia lại thang tọa độ. p(x, y) → p(x 0 , y 0 ) x 0 = x ∗ S x , y 0 = y ∗ S y +
Các phép toán theo không gian thực hiện thao tác tại từng điểm ảnh theo công thức g(x, y) = T [p(x, y)], trong đó f(x, y) và g(x, y) lần lượt là mức xám của điểm ảnh tại vị trí (x,y) của ảnh đầu vào và ảnh kết quả.
– Thao tác trên không gian từng nhóm điểm ảnh. g(x, y) = T [p(x 0 , y 0 )], (x 0 , y 0 ) ∈ D với p(x 0 , y 0 ), (x 0 , y 0 ) ∈ Dlà nhóm các điểm ảnh trong vùng D của ảnh đầu vào, g(x, y) mức xám của điểm ảnh tại vị trí (x,y) của ảnh kết quả.
– Thao tác trên không gian chuyển đổi.
+ T (f i ) Với (f i ) : Không gian tần số.
+ T (p i ) Với (p i ) : Không gian năng lượng.
Xử lý ảnh số trên phần mềm MATLAB
• Biến đổi ảnh thành ảnh đa mức xám.
• Biến đổi thành ảnh nhị phân lấy ngưỡng theo thuật toán Ostu.
– ằ anh2 = im2bw(anh1,Totsu);
– ằ BW = edge(I,’sobel’) – ằ H1=imread(’huanrace.jpg’);
– ằ BW = edge(I,’roberts’) – ằ BW = edge(I,’roberts’,thresh) – ằ [BW,thresh] = edge(I,’roberts’, ) Log:
Hình 2.13 - Ảnh ban đầu Hình 2.14 - Biên ảnh theo phương pháp canny.
Hệ thống camera quan sát
Các thành phần của hệ thống camera quan sát
Một hệ thống camera quan sát thường gồm các thành phần chính như sau :
Hình 2.15 - Sơ đồ hệ thống camera quan sát.
• Camera thu ảnh : Đăc trưng bởi các thông số chính sau : Giao thức :
– Camera analog : Tín hiệu điện được chuyển thành tín hiệu số thông qua bộ thu kỹ thuật số DVR kèm theo.
– Camera IP : Tín hiệu điện được chuyển thành tín hiệu số trực tiếp tại camera Kết nối trực tiếp vào mạng IP.
– Bộ cảm biến hình (Image Sensor): CCD hay CMOS.
– Độ phân giải (Resolution) : càng lớn càng tốt nhưng phải cân bằng với dung lượng và băng thông truyền.
– Camera thường hay IR camera (camera hồng ngoại, có thể quan sát vào ban đêm). Điều kiện hoạt động:
– Cường độ ánh sáng nhỏ nhất (Minimum Illumination): Độ sáng nhỏ nhất mà camera hoạt động được.
– Góc quan sát (tiêu cự) : Góc lớn nhất mà camera có thể quan sát được.
• Máy tính xử lý ảnh :
– Máy chủ xử lý ảnh từ đầu thu kỹ thuật số DVR hay trực tiếp từ camera IP.
– Một số camera hiện đại được tích hợp bộ vi xử lý nhúng trực tiếp trên camera.
– Hiển thị ra màn hình.
– Hiển thị ra đèn quang báo.
• Bộ phận lưu trữ và ra quyết định :
– Quyết định cho phép xâm nhập.
– Quyết định cho phép lưu thông.
– Khởi động hệ thống cảnh báo.
Nguyên lý hoạt động
Camera thu ảnh chụp lại không gian quan sát, gửi tín hiệu điện cho bộ thu kỹ thuật số mã hóa thành tín hiệu số, mỗi bức ảnh lúc này là các ma trận giá trị rời rạc Đồng thời gửi tín hiệu ra bộ phận hiển thị ảnh ban đầu Máy tính xử lý nhận tín hiệu số tiến hành xử lý theo yêu cầu của người dùng bằng các phần mềm cài đặt sẵn, hiển thị ảnh có chất lượng cao hơn hoặc gửi qua mạng IP tới những bộ phận quan sát từ xa hoặc trích xuất thông tin (nhận dạng), các thông tin này làm tín hiệu cho các thiết bị đóng ngắt mở khóa các cổng giao tiếp xâm nhập, các thiết bị cảnh báo Đồng thời các thông tin và hình ảnh này được lưu giữ cho cơ sở dữ liệu.
Hình 2.16 - Hệ thống camera quan sát (phần cứng)
Hệ thống nhận dạng biển số xe
Các loại biển số xe ở Việt Nam
Ở Việt Nam, biển kiểm soát xe cơ giới (hay còn gọi tắt là biển số xe) là tấm biển gắn trên mỗi xe cơ giới, được cơ quan công an cấp khi mua xe mới hoặc chuyển nhượng xe Biển số xe được làm bằng hợp kim nhôm sắt, có dạng hình chữ nhật hoặc hơi vuông, trên đó có in những con số và chữ cho biết: vùng và địa phương quản lý Đặc biệt trên đó còn có hình quốc huy dập nổi của ViệtNam. Đối với xe gắn máy :
• Biển số chuẩn có kích thước 19.5cm − 14.5cm.
• Gồm hai hàng ký tự.
• Hàng đầu tiên gồm hai nhóm ngăn cách bằng dấu gạch ngang.
• Nhóm đầu gồm hai chữ số xác định tỉnh thành.
• Nhóm cuối gồm một ký tự và một chữ số xác định quận huyện.
• Hàng thứ hai gồm 4 chữ số (trước đây) hoặc 5 chữ số hiện nay (gồm ba chữ số đầu và hai chữ số sau ngăn cách bởi một dấu chấm).
• Ví dụ ở thành phố Hồ Chí Minh :
Quận Tân Bình : 59-P1 XXX.XX Quận Tân Phú: 59-D1 XXX.XX Quận Bình Thạnh: 59-S1 XXX.XX Quận Gò Vấp: 59-V1 XXX.XX Quận Phú Nhuận: 59-E1 XXX.XX Quận Thủ Đức: 59-X2 XXX.XX Quận Bình Tân: 59-N1 XXX.XX Huyện Bình Chánh: 59-N2 XXX.XX Huyện Nhà Bè: 59-Z1 XXX.XX Huyện Cần Giờ: 59-Z2 XXX.XX Huyện Hóc Môn: 59-Y1 XXX.XX Huyện Củ Chi: 59-Y2 XXX.XX
Hình 2.17 - Biển xe gắn máy 4 số Hình 2.18 - Biển xe gắn máy 5 số.
Phân loại biển số xe :
• Phân loại theo màu sắc.
– Nền biển màu trắng, chữ màu đen là xe thuộc sở hữu cá nhân và xe của các doanh nghiệp.
– Nền biển màu xanh dương, chữ màu trắng là biển xe của các cơ quan hành chính sự nghiệp (dân sự).
– Nền biển màu đỏ, chữ màu trắng là xe quân đội, xe của các doanh nghiệp quân đội.
– Nền biển màu vàng chữ trắng là xe thuộc Bộ tư lệnh Biên phòng.
– Nền biển màu vàng chữ đen là xe cơ giới chuyên dụng làm công trình.
• Phân loại theo khu vực chức năng.
– Biển xe của các cơ quan hành chính sự nghiệp (dân sự).
– Biển xe các cơ quan thuộc Bộ Quốc Phòng.
– Biển số 80 các cơ quan trọng yếu trung ương.
– Biển ngoại giao liên doanh nước ngoài (NN,NG,LD).
(Theo Thông tư số 36/2010/TT-BCA ngày 12/10/2010 của Bộ Công An )
2.3.2 Sơ đồ khối và nguyên lý hoạt động của hệ thống nhận dạng biển số xe Hệ thống nhận dạng biển số xe tự động (ANPR) bao gồm các thành phần sau :
Hình 2.19 - Sơ đồ hệ thống nhận dạng biển số.
• Ảnh được camera chụp chuyển cho bộ xử lý hình học.
• Bộ xử lý hình học tiến hành các bước.
– Lọc nhiễu, tinh chỉnh biển số.
• Bộ phận nhận dạng tiến hành nhận dạng các mẫu ký tự hình học thu được.
• Bộ quyết định kết luận ký tự nhận được.
Các thuật toán xử lý ảnh và ứng dụng
Các thuật toán xử lý trên ảnh nhị phân
Thuật toán ảnh nhị phân
Thuật toán biến đổi ảnh xám thành ảnh nhị phân:
Mục đích : chuyển đổi các mức xám thành hai mức (1:trắng; 0: đen)
– Kết quả thực hiện bằng Matlab
Hình 3.1 - Ảnh xám ban đầu Hình 3.2 - Chọn ngưỡng đơn giản.
+ Tính toán nhanh chóng đơn giản.
+ Mất nhiều chi tiết đối với các ảnh có độ xám trải dài.
Chọn ngưỡng theo phương pháp Otsu cải tiến : Phương pháp Otsu cổ điển :
• Do Nobuyuki Otsu đề xuất năm 1978.
Giả sử ảnh được chia thành 2 miền đặc trưng khác nhau, miền nền đồng nhất và miền chứa đối tượng Xác định ngưỡng k để đạt cực tiểu sự khác biệt mức xám trong từng miền và cực đại sự khác biệt mức xám giữa miền đối tượng với miền nền và ảnh ban đầu.
• Cơ sở toán học : Các sự khác biệt trên được thể hiện bằng các phương sai Các giả thuyết :
– Giả sử ảnh xám có L mức xám [1, 2, , L]
– Số điểm ảnh có mức xám i là n i – Do đó tổng các điểm ảnh là : N = n 1 + n 2 + + n L
– Lược đồ mức xám được chuẩn hóa là :p i = n i
Chia đôi tập các điểm ảnh này thành hai tập con :
Xác suất xảy ra từng lớp:
+ ω 0 = P r (C 0 ) =Pk i=1 p i = ω(k) + ω 1 = P r (C 1 ) =PL i=k+1 p i = 1 − ω(k) Mức trung bình từng lớp xét trên tổng thể :
Mức trung bỡnh tổng thể : à T =
Mối quan hệ : ω 0 à 0 + ω 1 à 1 = à T ; ω 0 + ω 1 = 1Các phương sai :
Phương sai đo sự khác biệt:
+ Phương sai bên trong miền (within_class variance) : σ W 2 = ω 0 σ 0 2 + ω 1 σ 1 2
+ Phương sai giữa các miền (between_class variance) : σ B 2 = ω 0 (à 0 − à T ) 2 + ω 1 (à 1 − à T ) 2
Ta có : σ W 2 + σ B 2 = σ T 2 Các hệ số đo sự khác biệt :
+ λ = σ B 2 σ W 2 ; k = σ T 2 σ W 2 ; η = σ B 2 σ T 2 Ta có mối quan hệ :
+ k = λ + 1; η = 1 − λ+1 1 Ý tưởng trên được chuyển thành bài toán quy hoạch phi tuyến : "Tìm k sao các đại lượng k, λ, η đạt cực đại".
< anh2 = im2bw(anh1,Totsu);
Hình 3.3 - Ảnh xám ban đầu Hình 3.4 - Chọn ngưỡng theo Otsu Với ảnh trên, ngưỡng Otsu được tính bằng Matlab : k = 0.46 Đề xuất một cách chọn ngưỡng khác (dành cho ảnh biển số xe) + Ý tưởng dựa vào độ sáng tối của bức ảnh :
Sử dụng ở môi trường Viêt Nam với điều kiện ảnh sáng bình thường (t = 35 0 ), thực nghiệm với 400 ảnh biển số.
• Nếu ảnh sáng thì chọn ngưỡng là 185.
• Nếu ảnh tối thì chọn ngưỡng là 125.
Hình 3.5 - Ảnh xám ban đầu (rất sáng) Hình 3.6 - Chọn ngưỡng theo độ sáng.
Một số thuật toán đơn giản
Thuật toán tách các đối tượng lồng nhau
Hình 3.7 - Đối tượng trong ảnh.
• Dò biên trong và ngoài của đối tượng, duyệt tất cả các điểm bên trong biên, đặt giá trị mức 1.
• Xóa hết tất cả các đối tượng còn lại trong ảnh, đặt mức 0 cho tất cả các điểm đó
• Cắt đối tượng ra khỏi ảnh
• Phục hồi các đối tượng còn lại
Hình 3.11 - Phục hồi các đối tượng còn lại.
Cứ tiếp tục cho đến khi tách hết đối tượng trong ảnh.
• Đánh giá + Ưu điểm : tách được triệt để, kể cả các đối tượng lồng nhau.
+ Nhược điểm : phức tạp thuật toán Thuật toán 2 :
• cắt đối tượng theo một hình chữ nhật nhỏ nhất chứa đối tượng
Hình 3.12 - Hình chữ nhật chứa đối tượng.
• Đánh giá + Ưu điểm : Nhanh, đơn giản.
+ Nhược điểm : Tách các đối tượng bị dính liền sẽ sai lệch.
Thuật toán gióng thẳng các ký tự trên một hàng
• Dò biên đối tượng đầu tiên bên trái.
• Xác định trọng tâm của ký tự đó, và đường thẳng (∆) qua trọng tâm song song trục tọa độ.
• Tính bề cao ký tự lớn nhất H M
• Nếu điểm biên cao nhất hoặc thấp nhất của ký tự cách (∆) một khoảng h ≤ H M /2 thì kéo sát ký tự với (∆).
Hình 3.13 - Ký tự bị lệch Hình 3.14 - Ký tự được gióng hàng
• Đánh giá + Ưu điểm : Nhanh, đơn giản.
+ Nhược điểm : Hiệu quả thấp trong trường hợp các ký tự có độ cao khác biệt lớn.
Ứng dụng
Đặc điểm của tế bào máu :
– Bạch cầu – Hồng cầu – Tiểu cầu
• Bạch cầu kích thước lớn nhất, có nhân màu đậm bên trong.
• Hồng cầu kích thước trung bình, không có nhân, màu sáng.
• Tiểu cầu có kích thước rất nhỏ so với hai loại trên, màu đậm nhỏ hơn cả nhân của bạch cầu.
Hình 3.15 - Bạch cầu (lớn nhất), hồng cầu, tiểu cầu (các chấm nhỏ).
• Đếm bạch cầu nhờ đặc trưng kích thước lớn nhất và màu nhân đậm.
• Đếm tiểu đặc trưng kích thước nhỏ nhất và màu đậm.
• Đếm hồng cầu kích thước trung bình, có màu sáng.
• Lọc nhiễu, mất các hồng cầu.
• Quay lại bước đầu để đếm hồng cầu.
• Số lượng bạch cầu : WBCs= 1.
Hình 3.16 - Bạch cầu đếm được.
• Số lượng tiểu cầu : Platelets= 14.
Hình 3.17 - Tiểu cầu đếm được.
• Số lượng hồng cầu : RBCs= 47.
Hình 3.18 - Hồng cầu đếm được.
Nhận dạng đường biên
Khái niệm về đường biên và phương pháp nhận dạng đường biên
• Điểm biên của ảnh nhị phân: là điểm ảnh mà tại đó giá trị xám thay đổi đột ngột từ 0->1
Hình 4.1 - Đặc trưng thay đổi mức xám của các điểm biên ảnh.
• Đường biên : là đường song tập hợp các điểm biên Cơ sở để phân vùng và tách đối tượng là nhận dạng đường biên, cho nên bài toán nhận dạng đường biên và tách đối tượng là hai bài toán đối ngẫu.
• Phương pháp phát hiện biên (dò biên) cổ điển:
+ Nhóm phương pháp trực tiếp dựa vào đặc trưng thay đổi đột ngột giá trị mức xám của điểm biên.
+ Nhóm phương pháp dựa vào bài toán đối ngẫu, phân vùng trước suy ra biên sau.
Phương pháp gián tiếp
Cở sở toán học : dùng đạo hàm để biểu thị sự thay đổi giá trị xám f(x,y) của điểm biên.
Hình 4.2 - Đạo hàm tại đường biên.
+ Phương pháp sử dụng đạo hàm bậc nhất Một số khái niệm cơ sở:
• Phép nhân chập và cửa sổ mặt nạ
• Đạo hàm theo hướng và vecto gradient Vecto gradient tại điểm ảnh f(x, y)
∂x = f(x + 1, y) − f (x, y) dx đạo hàm theo hướng x
∂y = f(x, y + 1) − f (x, y) dy đạo hàm theo hướng y+ dx khoảng cách theo hướng x ( tính theo số điểm ảnh)+ dy khoảng cách theo hướng y ( tính theo số điểm ảnh)
Các công thức tính biên độ :
Giải pháp số xấp xỉ biên độ vecto Gradient:
∂x Biên độ Gradient tại điểm ảnh p 5 có thể được xấp xỉ như sau: p 1 p 2 p 3 p 4 p 5 p 6 p 7 p 8 p 9
Với dx = dy = 1 hai đạo hàm riêng trên có thể biểu diễn theo giá trị các điểm lân cận, theo hướng x và hướng y:
| ∇f(x, y)| ~ = |p 5 − p 9 | + |p 6 − p 8 | (xấp xỉ theo các điểm chéo) Để dễ cài đặt tính toán trong thuật toán, các xấp xỉ trên có thể thực hiện bằng phép nhân chập như sau :
G(x, y) = |f (x, y) ⊗ H x | + |f (x, y) ⊗ H y | Với H x , H y là hai ma trận (mặt nạ) nhân chập tương ứng.
Thuật toán chung nhận dạng đường biên + Lọc nhiễu.
+ Sử dụng toán tử Gradient để tạo ma trận ảnh Gradient trung gian G(x, y). + Tính ngưỡng Gradient T.
+ Làm nổi các điểm biên theo một tỉ lệ A, A ∈ (0, 1).
- G(x, y) > T là điểm biên → G(x, y) = f (x, y) + A.G(x, y). - G(x, y) ≤ T không phải điểm biên → G(x, y) = f (x, y). + Hiển thị ảnh từ ma trận Gradient.
Các phương pháp thuộc loại này : Khác nhau ở cách xấp xỉ biên độ vecto Gradient.
• Toán tử Prewitt : + Do J.M.S Prewitt đề xuất năm 1970 + Ta có thể xấp xỉ độ lớn vecto gradient bằng một nhóm nhiều điểm hơn với dx=dy=3, theo hai hướng x và y tính theo từng nhóm điểm :
Các mặt nạ tương ứng : Theo hướng x : Hx −1 −1 −1
Hình 4.4 - Ảnh ban đầu Hình 4.5 - Biên ảnh.
• Toán tử Sobel : + Do Duda và Hart đề xuất năm 1973.
+ Ta có thể xấp xỉ độ lớn vecto gradient bằng một nhóm nhiều điểm hơn với dx=dy=3, theo hai hướng x và y tính theo từng nhóm điểm :
Các mặt nạ tương ứng : Theo hướng x : Hx −1 −2 −1
Hình 4.6 - Ảnh ban đầu Hình 4.7 - Biên ảnh. Đánh giá chung của phương pháp đạo hàm bậc nhất:
• Tính toán cài đặt nhanh.
• Thiếu chính xác trong trường hợp biên kéo dài bề ngang.
• Không hiệu quả trong trường hợp biên có mức xám thay đổi chậm. Để cải tiến phương pháp đạo hàm bậc nhất, người ta đã có một số kỹ thuật như kỹ thuật la bàn (lấy xấp xỉ đạo hàm theo nhiều hướng, 4 hướng, 8 hướng, ), kỹ thuật mở rộng vùng điểm,
+ Phương pháp đạo hàm bậc hai : Một cách khắc phục những thiếu sót của phương pháp đạo hàm bậc nhất.
Sử dụng xấp xỉ đạo hàm cấp hai sau:
∂y 2 Sử dụng các xấp xỉ số tính đạo hàm cấp hai :
∇ 2 f = 4f (x, y) − f (x − 1, y) − f (x, y − 1) − f (x + 1, y) − f(x, y + 1) Đề xuất : Ta có thể xấp xỉ đạo hàm cấp hai theo sai phân như sau :
• Phương pháp Laplace: Từ các xấp xỉ trên sử dụng phép nhân chập như phần đạo hàm cấp 1 với các mặt nạ :
• Phương pháp Laplace of Gauss (LoG):
Phương pháp Laplace nguyên thủy có độ nhạy nhiễu rất cao nên được cải tiến bằng phương pháp LoG bằng cách lọc nhiễu Gauss trước khi hiện biên.
Hình 4.8 - Ảnh ban đầu Hình 4.9 - Biên ảnh.
Phương pháp Canny
+ Được John Canny làm việc ở phòng thí nghiệm nhân tạo MIT đề xuất năm 1986.
+ Theo Canny công việc dò biên thực chất là dùng một bộ lọc để lọc nhiễu đồng thời làm hiện biên Từ đó Canny xây dựng một bộ lọc đạt hiệu quả cao dựa vào ba ràng buộc sau :
• Mức lỗi (SNR): phương pháp phát hiện biên chỉ có ý nghĩa khi tìm được tất cả các biên mà không bị lỗi.
• Định vị (Localization): Mức xám chênh lệch giữa các điểm biên và các điểm không phải biên càng lớn càng tốt, mức xám chênh lệch giữa các điểm trên biên càng nhỏ càng tốt.
• Hiệu suất (X zc): phương pháp phát hiện biên tốt khi chỉ phát hiện đúng biên duy nhất không có biên ảo.
Các ràng buộc trên được thể hiện qua các điều kiện sau :
−∞ f 02 (x)dx bộ lọc f là bộ lọc thông giải trong đoạn [−w; w]
Bộ lọc f được xấp xỉ như là đạo hàm cấp một của hàm Gauss
Từ đó thuật toán thực hiện như sau : Giả sử ảnh cần xử lý là I, gọi g(x,y) là hàm Gauss
• Làm trơn ảnh với bộ lọc Gauss: S = I ⊗ g
• Lấy Gradient kết quả bước trên : ∇S = ∇(g ⊗ I) = ∇g ⊗ I Các mặt nạ nhân chập tương ứng :
Để loại bỏ các biên giới ảo, so sánh điểm biên thu được sau bước 2 với hai điểm lân cận Nếu giá trị điểm đang xét lớn nhất thì giữ lại, còn lại loại bỏ điểm biên này Do mỗi điểm I(x,y) có 8 điểm lân cận, nên việc chọn hai điểm lân cận dựa vào góc hướng θ như sau:
Trị số θ(đơn vị 0 ) Xấp xỉ θ (đơn vị 0 ) Cặp điểm lân cận [0; 22, 5]; [157, 5; 180] 0 I(x − 1, y), I(x + 1, y)
• Phân ngưỡng Dùng hai ngưỡng T h và T l , xét các điểm biên I(x, y) từ bước 3
– Nếu I(x, y) ≥ T h : Lấy điểm biên này – Nếu I(x, y) < T l : Bỏ điểm biên này
– Nếu T l ≤ I(x, y) < T h : Nếu trong 8 điểm lân cận có một điểm lớn hơn điểm đang xét thì nhận điểm biên này, ngoài ra bỏ điểm biên đó.
+ Phương pháp Canny được xếp vào nhóm phương pháp Gradient cho kết quả khá tốt:
Hình 4.10 - Ảnh ban đầu Hình 4.11 - Biên ảnh.
Nhận dạng khung
• Do Richard Duda và Peter Hart đưa ra vào năm 1972 dựa vào phát minh của Paul Hough năm 1962 và được phổ biến trong cộng đồng xử lý ảnh bởi bài báo của Dana H.Ballard năm 1981.
• Ý tưởng và công thức toán học:
– Xét trường hợp biến đổi Hough cho đường thẳng
– Xét trong mặt phẳng Oxy, một đường thẳng có hệ số góc a có phương trình :y = ax + b → b = (−x)a + y
– Từ đó với một điểm cố định (x 0 , y 0 ) các đường thẳng đi qua nó có dạng :b = (−a)x 0 + y 0 a,b thay đổi
– Mối quan hệ giữa b và a là đường thẳng trong không gian các điểm (a,b).
– Như vậy : Tương ứng một điểm (x,y) trong không gian (x,y) là một đường thẳng b = −xa + y trong không gian các điểm (a,b)
Bây giờ ta xét bài toán nhỏ như sau : cho vùng ảnh giả sử chỉ có ba điểm (x 1 , y 1 ), (x 2 , y 2 ), (x 3 , y 3 ) Ba điểm đó có thẳng hàng hay không? Nếu có , phương trình đường thẳng đó?
Với 3 điểm đã cho ta có tương ứng ba đường thẳng trong không gian (a,b) là :
Nếu (∆ 1 , (∆ 2 ), (∆ 3 )) đồng quy tại một điểm (a 0 , b 0 ) thì rõ ràng đường thẳng y = a 0 x + b 0 đi qua ba điểm đã cho.
Hình 4.12 - Ba đường thẳng đồng quy trong không gian (a, b). Đây chính là ý tưởng sơ khai, nhưng còn một thiếu sót trong trường hợp đường thẳng thẳng đứng x = a Để khắc phục điều này, phải sử dụng tham số khác (a, b) Xét tham số (r, θ) được xác định như sau :
– r : khoảng cách từ gốc tọa độ đến đường thẳng – θ : góc giữa 0x với pháp tuyến của đường thẳng (hướng từ gốc đến đường thẳng)
Trong hệ tọa độ cực, tất cả các đường thẳng đều có thể biểu diễn thành dạng r = xcosθ + ysinθ, với r > 0 và θ thuộc [0; 2Π] Đường cong trong không gian xác định bởi thông số (r, θ) này cắt nhau tại các điểm, tạo thành các đường thẳng.
Hình 4.14 - Các đường cong trong không gian (r, θ).
Giả sử ảnh có kích thước I M ×N , r ∈ [0, √
– Trong mặt phẳng(r, θ)rời rạc hóa các chiều với các khoảng cách làdr, dθ cùng kích thước với ảnh
– Khởi tạo một ma trận A(h, k) có các phần tử bằng 0
– Với mỗi điểm ảnh I (i, j) và h tính r = isinθ d (h) + jcosθ d (h), trong đó θ d (h) = hdθ
– Tìm chỉ số k sao cho r d (k) gần với r nhất – Tăng A(h, k) lên một đơn vị
– Tìm các cực trị A(h,k) thỏa A(h,k)> T T là một giá trị ngưỡng.
– Các đường thẳng cần tìm là các cặp (r d (k), θ d (h))
• Thực hiện trong Matlab Chương trình tìm và hiển thị đường thẳng trong ảnh dùng biến đổi Hough. rotI = imrotate(I,33,’crop’);
BW = edge(rotI,’canny’);[H,T,R] = hough(BW); imshow(H,[],’XData’,T,’YData’,R,’InitialMagnification’,’fit’); xlabel(’ theta’), ylabel(’ rho’); axis on, axis normal, hold on;
P = houghpeaks(H,5,’threshold’,ceil(0.3*max(H(:)))); x = T(P(:,2)); y = R(P(:,1)); plot(x,y,’s’,’color’,’white’); lines = houghlines(BW,T,R,P,’FillGap’,5,’MinLength’,7); figure, imshow(rotI), hold on max_len = 0; for k = 1:length(lines) xy = [lines(k).point1; lines(k).point2]; plot(xy(:,1),xy(:,2),’LineWidth’,2,’Color’,’green’); plot(xy(1,1),xy(1,2),’x’,’LineWidth’,2,’Color’,’yellow’); plot(xy(2,1),xy(2,2),’x’,’LineWidth’,2,’Color’,’red’); len = norm(lines(k).point1 - lines(k).point2); if ( len > max_len) max_len = len; xy_long = xy; end end plot(xy_long(:,1),xy_long(:,2),’LineWidth’,2,’Color’,’blue’);
Hình 4.15 - Biến đổi Hough của ảnh Hình 4.16 - Các đường thẳng dò được.
Ứng dụng
Nhận dạng các hình học cơ bản : Cho hình H, gọi
• a : khoảng cách lớn nhất từ tâm đến biên.
• b : khoảng cách nhỏ nhất từ tâm đến biên.
• S k : diện tích vùng nhận dạng.
Hình 4.17 - Thông số a, b của các hình.
Với hình chữ nhật tính được diện tích là S = 4bp
(a 2 − b 2 ) Với hình vuông tính được diện tích là S = 4b 2
Với hình thoi tính được diện tích là S =
Với hình tam giác đều tính được diện tích là S = (a+b) 2
Với hình elip tính được diện tích là S = abΠ Xét các hệ số sau :
Tùy theo giá trị của các hệ số trên ta nhận dạng được hình vẽ:
- Nếu 0.95 < K hv < 1.05 : kết luận là hình vuông.
- Nếu 0.95 < K elip < 1.05: kết luận là hình elip.
- Nếu 0.95 < K thoi < 1.05: kết luận là hình thoi.
- Nếu 0.95 < K tgdeu < 1.05: kết luận là tam giác đều.
- Nếu 0.95 < K hcn < 1.05: kết luận là hình chữ nhật.
• Xác định tọa độ tâm đối tượng
• Xác định khoảng cách từ các điểm biên tới tâm.
• Xác định diện tích bao phủ
• Tính các hệ số hình.
Hình 4.18 - Các hình đã nhận dạng.
Giải pháp đề xuất khác : Dùng biến đổi Hough để tính phương trình các đường thẳng, dựa vào các tham số vecto pháp tuyến để tìm số góc :
• Ba góc : là tam giác
• Bốn góc là tứ giác
• Bốn góc vuông là hình chữ nhật
• Hình tròn nhận dạng sử dụng biến đổi Hough để tìm đường tròn.
Nhận dạng biển số xe
Quy trình nhận dạng biển số xe :
Hình 5.1 - Quy trình nhận dạng biển số. Ở đây 5 bước đầu tiên sử dụng những thuật toán đã giới thiệu của các chương trước :
• Thuật toán chuyển ảnh màu về ảnh xám
• Thuật toán chuyển ảnh xám thành ảnh nhị phân
• Thuật toán hình học trên ảnh (co giãn, quay, ).
• Thuật toán nhận dạng biên.
• Thuật toán tìm đường thẳng Hough.
• Thuật toán tách đối tượng.
Việc lựa chọn phương pháp có kết quả tốt còn dựa vào thực tế thực nghiệm.
Chuyển thành ảnh xám
Những thuật toán cho việc cắt biển số, tách ký tự của các bước sau đều có ngõ vào là ảnh xám, ảnh nhị phân.
Hình 5.2 - Ảnh ban đầu Hình 5.3 - Ảnh xám.
Cắt vùng biển số
• Cơ sở thuật toán: biển số là một tứ giác gần với hình bình hành, hình chữ nhật có kích thước lớn nhất trong ảnh chứa biển sô
– Dò biên với phương pháp Canny.
– Tìm đường thẳng sử dụng biến đổi Hough.
– Cắt tứ giác có diện tích lớn nhất.
Hình 5.4 - Ảnh xám ban đầu Hình 5.5 - Ảnh đã hiện biên.
Hình 5.6 - Đường thẳng Hough Hình 5.7 - Ảnh vùng biển số đã cắt và xoay.
Trong một số trường hợp, góc nhìn camera và vị trí lệch của biển số khiến hình dạng biển số thu được không phải hình chữ nhật chuẩn Điều này gây khó khăn cho việc tách và nhận dạng ký tự Do đó, sau khi cắt biển số, cần thực hiện thêm bước căn chỉnh biển số để thành hình chữ nhật chuẩn.
Tiến hành lọc nhiễu
Hình 5.8 - Biển số ban đầu Hình 5.9 - Biển số đã lọc nhiễu.
Chuyển sang ảnh đen trắng
• Thuật toán sử dụng : phân ngưỡng theo thực nghiệm.
Hình 5.10 - Biển số xám ban đầu Hình 5.11 - Biển số nhị phân.
Tách ký tự
• Thuật toán sử dụng : phương pháp 2 của bài toán tách đối tượng chương trước.
Hình 5.12 - Các ký tự đã tách.
Nhận dạng ký tự
Cơ sở toán học và thuật toán
Căn bản của việc nhận dạng ký tự hay là nhận dạng một đối tượng bất kỳ đều dựa vào hai hướng chính :
• Tìm thuộc tính đặc trưng của đối tượng để kết luận đó là gì.
• So sánh với các đối tượng mẫu để tìm cái giống nhất.
Trong việc nhận dạng ký tự thì hướng thứ nhất không hiệu quả, luận văn đi theo hướng thứ hai So sánh ký tự thu được với ký tự mẫu là so sánh hai ma trận của hai ký tự đó Trong việc so sánh này cũng có hai phương pháp thường dùng:
• Phương pháp so sánh trực tiếp hai ma trận ký tự : – Ưu điểm : Đơn giản, dễ cài đặt Tốc độ tính toán rất nhanh trong một số trường hợp.
– Nhược điểm : Độ chính xác không cao
• Phương pháp dùng mạng Neural : so sánh với nhiều tập mẫu.
– Ưu điểm : Độ chính xác tốt.
– Nhược điểm : Lý thuyết và cài đặt phức tạp.
Trong việc nhận dạng biển số xe, sau khi tinh chỉnh và tách từng ký tự trong biển số, phương pháp so sánh trực tiếp hai ma trận đem lại kết quả chính xác cao, đơn giản và hiệu quả.
Thuật toán so sánh hai ma trận :
• Tính hệ số đo sự khác biệt k A
• Xác định giá trị ngưỡng T A
– Nếu k A ≥ T A : kết luận hai ma trận giống nhau.
– Nếu k A < T A : kết luận hai ma trận không giống nhau.
Giá trị T A được tính dựa vào thực nghiệm trên nhiều mẫu Trong một số trường hợp có thể có nhiều giá trị ngưỡng tương ứng với các mức ý nghĩa Chẳng hạn trường hợp hai mức ngưỡng T A l và T A h
• Nếu k A ≥ T A h : kết luận hai ma trận giống nhau.
• Nếu T A l ≤ k A < T A h : kết luận hai ma trận giống nhau với mức α%.
• Nếu k A < T A l : kết luận hai ma trận không giống nhau.
Giá trị k A có những cách tính sau :
• Cách đơn giản nhất : so sánh từng phần tử một.
Gọi A R là ma trận ký tự thu được.
Gọi A T là ma trận ký tự mẫu.
Gọi A k = A R − A T Lúc đó: k A có thể xác định k A = kA k k Đánh giá :
– Không thực hiện được khi hai ma trận so sánh có kích cỡ khác nhau.
Nếu chuẩn hóa kích thước thì độ chính xác sẽ giảm.
• Cách tính dựa vào hệ số tương quan giữa hai ma trận (matrix correlation). k A = r : r =
P n (A mn − A) ¯ 2 (B mn − B ¯ ) 2 Với A ¯ = mean(A), B ¯ = mean(B ).khi A, B là vecto dãy một chiều.
Hay A ¯ = mean(A, :), B ¯ = mean(B, :).khi A, B là ma trận 2 chiều. Đánh giá : Đây là cách được lựa chọn trong luận văn này.
– Đơn giản, độ chính xác cao.
– Thực hiện được khi hai ma trận so sánh có kích cỡ khác nhau bằng cách chuẩn hóa kích thước, hệ số r không thay đổi sau khi thay đổi kích thước.
Thuật toán nhận dạng ký tự :
– Lưu một tập ký tự mẫu C i
– Với mỗi ký tự thu được, tính hệ số k A i với tất cả các ký tựC i trong tập mẫu.
– Tính giá trị lớn nhất K A trong các hệ số k A
– So sánh với ngưỡng cao T A h và ngưỡng thấp T A l để kết luận, ký tự thu được là ký tự C K với mức chấp nhận tương ứng.
Kết quả thực hiện và đánh giá
• Thực hiện : Với ngưỡng chọn : ngưỡng cao T A h = 0.7 và ngưỡng thấp T A l = 0.4
– Với số 2 : Hệ số tương quan với mẫu 2 là cao nhất : r = 0.7069
• Đánh giá : Với phương pháp tính hệ số tương quan giữa hai ma trận ảnh ký tự, với những phông chữ tương đồng thì độ chính xác tương đối cao Ngay cả khi áp dụng trên nhiều phông chữ khác biệt, hay ký tự thu được có sự biến dạng lớn.
Với bộ phông Time New Roman :
Hình 5.13 - Phông Time New Roman.
Với bộ phông tạo từ các ký tự trên biển số thực tế :
Với bộ phông Book Antiqua :