.15 Nhân chập ảnh với mặt nạ

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng robot di động sử dụng thị giác máy có khả năng bắt bóng (Trang 54 - 56)

M0 M1 M2 M3 M4 M5 M5 M6 M7  mặt nạ nhân chập ảnh đầu vào I0M0 I1M1 I2M2 I3M3 I4M4 I5M5 I6M6 I7M7 pixel mới + ảnh đầu ra I0 I1 I2 I3 I4 I5 I6 I7 I8 cửa sổ nhân chập

Với mỗi pixel I(i,j) được xử lý thì các pixel lân cận của nó được xem xét để tính tốn giá trị ảnh lối ra I'(i,j). Chẳng hạn ta xét mặt nạ 33 tức là r = 1 thì 8 lân cận của I(i,j)là từ I1 tới I8 và trọng số của mặt nạ sẽ là từ W0 tới W8. Hình 2.15 mơ tả phép tính cho pixel I(i,j).

Trong ảnh video thường có hai nguồn nhiễu chính là: nhiễu muối tiêu và nhiễu cuộn. Nhiễu muối tiêu (salt-and-pepper) xuất hiện khi một hình ảnh được mã hố và truyền qua một kênh có nhiễu hoặc ồn điện tử của bộ cảm biến trong camera video. Nhiễu cuộn (convolutional) do thấu kính không hội tụ, sự chuyển động, hoặc sự nhiễu loạn khí quyển trong những điều kiện thời tiết bất lợi. Cả hai nguồn nhiễu này phân bố ở các thành phần tần số cao. Nhằm mục đích loại bỏ hai nhiễu trên ta thường dùng bộ lọc gauss hoặc lọc trung vị.

Lọc gauss cho phép loại bỏ nhiễu tần số cao nhưng nó lại làm mờ biên ảnh. Lọc gauss được thực hiện qua phép toán nhân chập với mặt nạ gauss.

Lọc trung vị (median) được sử dụng để giảm bớt tiếng ồn tần số cao và nó giữ được thơng tin biên của đối tượng. Nhưng phép lọc này mất khá nhiều thời gian. Đây là kỹ thuật lọc không gian phi tuyến, không dùng phương pháp nhân chập. Có thể mơ tả vắn tắt thuật tốn lọc như sau. Xét pixel I0 và các lân cận (lân cận 8 chẳng hạn) của nó, xắp xếp các giá trị I0 và các giá trị của các pixel lân cận theo thứ tự

tăng dần. Giá trị nằm chính giữa sẽ được gán cho pixel I0.

2.6 Xử lý hình thái học ảnh nhị phân

2.6.1 Phép biết đổi “trúng hoặc trượt”

Những tốn tử hình thái học nhị phân như dãn lân cận 8, co lân cận 8 và làm đầy đường chéo có thể được phân vào loại biến đổi “trúng hoặc trượt”. Biến đổi trúng hoặc trượt sử dụng khái niệm nhân chập một mặt nạ nhỏ (gọi là phần tử cấu trúc) với một ảnh nhị phân để tạo ảnh lối ra. Nếu mẫu trong ảnh phù hợp với mẫu của mặt nạ thì được gọi là “trúng” và đặt pixel ở vị trí đó có giá trị nhị phân mong muốn (1 chẳng hạn). Nếu ngược lại được gọi là “trượt” và pixel được đặt giá trị (0).

Những phép biến đổi trúng hoặc trượt thảo luận trong phần này làm việc với một mặt nạ cỡ 3x3. Điều này có nghĩa rằng giá trị của mỗi pixel chỉ phụ thuộc vào 8 pixel lân cận của nó. Phép nhân chập có thể được thực hiện bằng cách sử dụng một bảng tìm kiếm chỉ có 29 = 512 mẫu trong ảnh nhị phân. Điều này nhằm tăng tốc độ xử lý.

2.6.2 Phương pháp lập bảng tìm kiếm

Mỗi pixel và 8 lân cận của nó trong ảnh nhị phân có thể được biểu diễn một cách đầy đủ bởi một số nguyên dương 9 bit. Điều này được hoàn thành bởi việc gán mỗi điểm trong khu lân cận cho một vị trí bit riêng biệt trong một số nguyên 9 bit, hình 2.16 mơ tả cách biểu diễn này.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng robot di động sử dụng thị giác máy có khả năng bắt bóng (Trang 54 - 56)

Tải bản đầy đủ (PDF)

(117 trang)