Đầu tiên, tác giả xin giới thiệu vài nét về hình thái học. Đây là một phương pháp cơ bản và phổ biến trong kỹ thuật xử lý ảnh, nhằm nâng cao chất lượng ảnh, kiểm tra khiếm khuyết của đối tượng, phân đoạn ảnh [13].
Các phép toán cơ bản của hình thái học là: phép bù của một ảnh, phép tịnh tiến, phép toán refection (phản xạ ảnh), AND 2 ảnh, OR 2 ảnh, phép tịnh tiến. Dilation (phép giãn ảnh), Erosion (phép co ảnh), Opening (phép mở ảnh), Closing (phép đóng ảnh). Để sử dụng các phép toán này, ta cần một st
ructure element (phần tử cấu trúc). Nó là một ảnh con, được dùng để dò ảnh đầu vào theo một quy luật nhất định. Structure element có một tâm ảnh (origin), nó có thể ở trung tâm hoặc ở ngoài rìa của structure element. Vị trí của tâm có ảnh hưởng lớn đến các phép toán. Cùng với loại phép toán, structure element đóng vai trò quan trọng trong việc quyết định ảnh ra. Structure element thường có các dạng sau:
20
Hình 3.11 Một số structure element thường gặp
Gọi ảnh vào là A, structure element là B, ta có định nghĩa về một số phép morphology được sử dụng trong luận văn như sau.
Reflection: kí hiệu ^, ảnh phản xạ 𝐵̂ là tập hợp tất cả các phần tử đối xứng với
các điểm trong 𝐵 qua tâm ảnh của 𝐵.
𝐵̂ = {𝑤|𝑤 ∈ −𝑏, 𝑏 ∈ 𝐵} (3.13)
Hình 3.12 Ví dụ về Reflection
Dilation: kí hiệu ⊕, ảnh ra là tập hợp ảnh vào và phần mở rộng bởi 𝐵
𝐴 ⊕ 𝐵 = {𝑧|(𝐵̂) ∩ 𝐴 ≠ ∅}𝑧 (3.14)
Hình 3.13 Ví dụ về phép Dilation
Erosion: kí hiệu ⊖, ảnh ra là tập hợp ảnh vào trừ đi các phần bị làm mòn bởi
𝐵
21
Hình 3.14 Ví dụ về phép Erosion
Opening: kí hiệu ∘, là sự kết hợp giữa 2 phép toán theo thứ tự Erosion - Dilation
𝐴 ∘ 𝐵 = (𝐴 ⊖ 𝐵) ⊕ 𝐵 (3.16)
Hình 3.15 Ví dụ về phép Opening
Closing: kí hiệu °, là sự kết hợp giữa 2 phép toán theo thứ tự Dilation – Erosion
𝐴°𝐵 = (𝐴 ⊕ 𝐵) ⊖ 𝐵 (3.17)
22
Quay trở lại nội dung của luận văn, tác giả sử dụng kỹ thuật Opening. Mục đích của việc này là tạo một bước tiền xử lý cho việc phát hiện và nhận dạng biển báo. Kỹ thuật này gồm hai giai đoạn. Đầu tiên, ảnh sẽ bị làm mòn bởi structure element. Khi đó những phần tử nhiễu nhỏ như dấu chấm sẽ bị loại bỏ (Erosion), tuy nhiên các phần tử khác cũng bị ảnh hưởng. Đến giai đoạn tiếp theo, các phần tử còn lại trong ảnh sẽ được mở rộng (Dilation), trả về đúng kích thước và hình dạng của nó như ban đầu. Nhờ đó, việc tính toán xử lý phía sau sẽ dễ dàng hơn và ít bị phát hiện sai hay nhận diện sai đối tượng.