3 Phương pháp nhận dạng biển báo thời gian thực
3.3 Nhận dạng loại biển báo giao thông đường bộ
3.3.1 Nhận dạng qua điểm đặc trưng cục bộ
Sử dụng đặc trưng điểm cục bộ bất biến để so sánh ảnh mang lại kết quả rất tốt trong nhiều trường hợp. Khi áp dụng vào bài toán nhận dạng biển báo giao thông đường bộ theo thời gian thực trên thiết bị di động thì SURF là thuật toán trích chọn đặc trưng cục bộ phù hợp nhất về cả thời gian và tài nguyên sử dụng. Các điểm đặc bất biến được trích chọn từ SURF không bị ảnh hưởng bởi góc quay của thiết bị thu hình cũng như cường độ ánh sáng khác nhau của ảnh thu nhận.
Giai đoạn nhận dạng biển báo được chia làm hai phần, phần một là tìm và lưu trữ các điểm đặc trưng SURF của mỗi biển báo từ bộ dữ liệu các biển báo giao thông đường bộ Việt Nam trong quy chuẩn tạo thành một bộ dữ liệu mẫu hay còn gọi là bộ dữ liệu học. Bước thứ hai là tìm và so khớp các biển báo tiền đoán từ giai đoạn phát hiện biển báo với bộ dữ liệu học. Việc so khớp đặc trưng SURF sử dụng phương pháp FANN (Fast Approximate Nearest Neighbors) [15]. Với số lượng đặc trưng SURF thu được từ ảnh tiền đoán đủ nhiều và trùng khớp nhiều nhất với một biển báo trong bộ dữ liệu học thì kết luận ảnh tiền đoán nhận là biển báo có số hiệu trùng khớp đó. Mô hình hoá việc tìm và so sánh đặc trưng SURF bằng FANN được thể hiện trong hình 3.5.
Hình 3.5: Tìm và so sánh đặc trưng SURF với FANN
Sau khi triển khai pha nhận dạng bằng thuật toán SURF kết quả không đạt như mong đợi vì vùng chứa biển báo giao thông đường bộ trong ảnh thu nhận được thường nhỏ và có nhiều điểm tương đồng với các biển báo khác, gây nên sự nhập
ementary features)[2] và BRISK (Binary robust invariant scalable keypoints)[14] là những ví dụ điển hình. Qua nghiên cứu và tìm hiểu chúng tôi nhận thấy sử dụng đặc trưng nhị phân hoá sự phụ thuộc các điểm ảnh là một hướng đi khả quan cho bài toán nhận dạng biển báo giao thông. Chúng tôi đề xuất sử dụng tư tưởng của phương pháp lấy đặc trưng nhị phân trong giải thuật BRIEF kết hợp với việc lấy mẫu theo phân bố Gaussian của giải thuật BRISK để trích chọn đặc trưng các biển báo. Mỗi biển báo sau khi được phân tích trích chọn đặc trưng sẽ được đặc tả dưới dạng một chuỗi nhị phân mang tính chất riêng của mình. Việc thực hiện so khớp các biển báo cũng chính là việc tính sự tương đồng của hai chuỗi nhị phân đặc các biển báo đó.
Quá trình lấy mẫu và đặc tả nhị phân hoá sự phụ thuộc các điểm ảnh được chúng tôi thực hiện chi tiết như sau:
• Chọn lọc các điểm mẫu:Với đầu vào là các ảnh hình vuông có khả năng chứa biển báo - ảnh tiền đoán đã được chuẩn hoá ở giai đoạn phát hiện - chúng tôi xác định các điểm mẫu qua phân bố Gaussian để tính các khoảng cách từ tâm của ảnh đến các điểm mẫu. Tâm của ảnh cũng là một điểm mẫu.
Hình 3.6: Các điểm mẫu theo phân bố Gaussian
Các điểm mẫu sẽ nằm trong các đường tròn đồng tâm được trực quan hoá như ở hình 3.6.
• Trích chọn các đặc trưng: Cũng như tên gọi đặc trưng nhị phân hoá sự phụ thuộc các điểm ảnh sẽ là tập hợp các giá trị nhị phân đặc trưng cho sự phụ thuộc của mỗi cặp điểm ảnh. Sự phụ thuộc được quan tâm ở trong trường hợp này là cường độ sáng của hai điểm ảnh. Nếu cường độ sáng của điểm ảnh
A(x1, y1) lớn hơn hoặc bằng cường độ sáng của điểm B(x2, y2) thì giá trị nhị phân biểu diễn sự phụ thuộc của hai điểm ảnh là 1, ngược lại thì là 0. Bằng các cách chọn các điểm A(x1, y1), B(x2, y2) khác nhau thuộc tập các điểm mẫu để tính sự phụ thuộc lẫn nhau của chúng sẽ thu được một dãy các giá trị nhị phân đặc trưng cho ảnh đầu vào.
Sắp xếp dãy các điểm lấy mẫu theo thứ tự gần tâm của ảnh nhất từ phía trên theo hướng kim đồng hồ đứng trước thu được một dãy gọi là dãy các điểm mẫu. Bằng cách duyệt từ đầu đến cuối dãy các điểm mẫu chúng tôi sử dụng phương án lấy ra các cặp điểm A(x1, y1), B(x2, y2) để tính sự phụ thuộc như sau:
– Chọn A(x1, y1), B(x2, y2) là các điểm liên tiếp gần kề nhau trong dãy các điểm mẫu.
– Chọn A(x1, y1), B(x2, y2) là các điểm liên tiếp cách nhau 5 điểm trong dãy các điểm mẫu.
– Chọn A(x1, y1), B(x2, y2) là các điểm liên tiếp cách nhau 13 điểm trong dãy các điểm mẫu.
Ví dụ với D là dãy các điểm mẫu chứa 15 điểm mẫu:
D = {x0(50, 50), x1(51, 51), x2(50, 52), x3(49, 51), x4(48, 50), x5(48, 48), x6(50, 48), x7(51, 49), x8(53, 50), x9(53, 52), x10(52, 53), x11(50, 53), x12(48, 53), x13(47, 52), x14(46, 51)}
Và d là mảng chứa cường độ sáng của lần lượt các điểm x0, x1 ... x14:
d = [210, 207, 207, 213, 220, 211, 255, 199, 202, 204, 211, 198, 200, 210, 220]
Bằng phương pháp chọn lấy các cặp để tính đặc trưng như đã đề xuất thu được tập các cặp điểm mẫu như sau:
{(x0,x1),(x1,x2),(x2,x3),(x3,x4),(x4,x5),(x0,x5),(x5,x6),(x1,x6) (x6,x7),(x2,x7),(x7,x8),(x3,x8),(x8,x9),(x4,x9),(x9,x10),(x5,x10) (x10,x11),(x6,x11),(x11,x12),(x7,x12),(x12,x13),(x8,x13),(x0,x13) (x ,x ),(x ,x ),(x ,x )}
hai ảnh. Chúng tôi sử dụng độ đo Hamming cho dãy nhị phân để so sánh hai dãy nhị phân hay cũng là tính trọng số tương đồng hai ảnh mà hai dãy đặc tả.
Trong bài toán nhận dạng biển báo giao thông đường bộ Việt Nam chúng tôi sửa dụng các giá trị sau cho giai đoạn nhận dang biển báo với đặc trưng nhị phân hoá các điểm ảnh. Sigma của hàm Gaussian σ = 1.4, số điểm mẫu là 312 điểm trong ảnh có kích thước 100x100 px.
Chương 4
Thực nghiệm