CHƯƠNG 2 : CƠ SỞ LÝ THUYẾT
2.2 PHƯƠNG PHÁP ĐƯỢC SỬ DỤNG TRONG LUẬN VĂN
2.2.2 Biểu diễn ảnh
Việc lựa chọn tập các đặc trưng nổi bật tối ưu cho một số lượng lớn các hình ảnh
biển báo giao thông là bài toán không dễ giải quyết. Cách dễ nhất để thực hiện việc
này có lẽ là trích xuất các vùng điểm ảnh đã được xác định trước mà chứa các đặc điểm nổi bật của từng hình biển báo. Các vùng ảnh đặc trưng này thường được xác định trước bằng tay mà không quan tâm đến giá trị khác biệt về đặc trưng của vùng
ảnh được chọn, vì vậy kết quả hoàn toàn phụ thuộc vào cách thức, kinh nghiệm chủ
quan của người lựa chọn. Một phương pháp khác cũng thường được sử dụng đó là đó
là biểu diễn mỗi biển báo giao thông dưới dạng tập các thống kê hình học tổng quát như moment, histogram, tỉ lệ các màu,….Tuy nhiên, các kỹ thuật này chỉ chứng minh
hữu dụng khi mà số lượng biển báo giao thông cần phân loại không nhiều và những
biển báo này cũng cần khác biệt tương đối với nhau. Khi mà số lượng biển báo hay sự tương đồng giữa các biển báo tăng lên thì các giá trị moment, tỉ lệ các màu, histogram hay các mô tả hình học khái quát sẽ có giá trị gần giống nhau và ít khác biệt để phân loại. Điều này được chứng minh qua các kết quả đạt được từ các báo cáo
sử dụng phương pháp này.
Qua tìm hiểu các phương pháp đã được sử dụng để giải quyết vấn đề kỹ thuật lựa
yếu (Principal Component Analysis) kết hợp thuật toán học thích nghi tăng cườngAdaBoost ( Adaptive Boost).
Tuy nhiên do tập trung vào việc tìm kiếm các khác biệt toàn cục trên tập bao gồm
tất cả các đối tượng nên phương pháp PCA không có khả năng trích xuất các đặc trưng nổi bật cho từng lớp màu riêng rẽ của ảnh, mà đây là một đặc điểm cần được khai thác. Hơn nữa, AdaBoost được biết đến như là một thuật toán học mạnh, giúp đẩy nhanh việc tạo ra một bộ phân loại mạnh (strong classifier) bằng cách chọn các đặc trưng tốt trong một họ các bộ phân loại yếu (weak classifier - bộ phân loại yếu)
và kết hợp chúng lại tuyến tính bằng cách sử dụng các trọng số (Hình 2.5).
Hình 2.5: Lược đồ cơ bản của AdaBoost
Nhưng giải thuật AdaBoost ban đầu được phát triển nhằm giải quyết vấn đề phân
loại nhị phân (có/không) và sau đó được sử dụng để phân biệt đối tượng bằng cách kết nối liên tiếp nhiều lớp phân loại nhị phân khác nhau. Bên cạnh đó, việc huấn
luyện AdaBoost cần sử dụng một tập lớn dữ liệu mẫu. Việc thu thập hình ảnh và tiến
hành tiền xử lýđể tạo ra các tập mẫu này là một công việc đòi hỏi nhiều thời gian và công sức, điều này lại càng khó khăn hơn khi một số biển báo giao thông rất ít gặp
ngoài thực tế. Hơn nữa, biển báo giao thông là một đối tượng được xây dựng dựa trên những quy định rõ ràng về hình dáng, màu sắc khung và kèm theo một ít khác biệt về
Một vấn đề khác nữa chính là việc lựa chọn biểu diễn hình ảnh sao cho các đặc trưng nổi bật được thể hiện rõ nét. Qua tìm hiểu, học viên nhận thấy rằng hầu hết mô
tả hình dáng ở mức độ cao hơn thông quá các giá trị moment với các bậc khác nhau
không phù hợp để thể hiện các đối tượng khả nghi là hình ảnh biển báo giao thông đường bộ. Hay nói cách khác, các phương pháp dựa trên từng điểm ảnh cụ thể thường có khuynh hướng rất dễ bị tác động bởi nhiễu hình học như các thay đổi nhỏ về vị trí
do sự lệch, xoay, nghiêng, ngã hay không đồng nhất của đối tượng. Phương pháp dựa
trên việc tính toán các giá trị histogram có thể khắc phục được hạn chế này nhưng đổi
lại nó không thể hiện được sự sắp xếp, thứ tự, mối tương quan giữa các điểm ảnh với
nhau mà chỉ mô tả dựa trên những thống kê chung về ảnh. Một số kết quả thực
nghiệm qua các báo cáo đã chứng minh rằng dùng phương pháp dựa trên histogram có thể cho kết quả khả quan trong việc phát hiện biển báo giao thông dựa trên hình dạng. Tuy nhiên việc so sánh sẽ gặp khó khăn và cho kết quả kém chính xác do nhiễu
từ môi trường, độ phân giải, kích thước đối tượng.
Hình 2.6: Một số cặp hình biển báo có mô tả histogram gần giống nhau
Từ các kết quả tìm hiểu được, trong luận văn này học viên lựa chọn giải thuật
trích xuất từng ảnh mẫu biển báo giao thông một số lượng giới hạn nhất định các
vùng ảnh cụ bộ được cho là khác biệt nhất với các ảnh mẫu biển báo giao thông khác. Các vùng đặc trưng được trích xuất này sau đó sẽ được đem ra so sánh giữa ảnh quan
sát thu được từ camera với ảnh mẫu biển báo giao thông lý tưởng để tìm mức độ khác
biệt nhằm thực hiện việc phân loại biển báo giao thông một cách ổn định và trực
tuyến. Nhưng trước khi giới thiệu giải thuật lựa chọn vùng ảnh đặc trưng, ta cần tìm hiểu về phép biến đổi khoảng cách ảnh màu ( Colour Distance Transform), một phép biến đổiảnh gốc ban đầu thành ảnh mô tả riêng rẽ từng màu phù hợp hơn cho việc xử