4. Cấu trúc nội dung của luận án
1.3.1. Phương pháp tính tốn bản đồ chênh lệch/độ sâu
Vấn đề tương đồng trong ảnh thị giác nổi là tìm các đối tượng tương ứng giữa hai hình ảnh đầu vào [41], [42], được nghiên cứu trong nhiều năm gần đây. Đây là một trong những vấn đề cơ bản trong lĩnh vực thị giác máy tính hỗ trợ cho nhiều ứng dụng nghiên cứu thị giác máy tính sâu hơn như nhận dạng đối tượng, trích đặc trưng... Cụ thể vấn đề tương đồng ảnh nổi là quá trình tìm kiếm từng điểm trong ảnh bên trái, tương ứng của nó ở bên phải. Sự khác biệt giữa khoảng cách ngang và dọc của các điểm này
Máy ảnh RGB-D/ Máy ảnh nổi Xử lý hình ảnh Cơ cấu chấp hành
gọi là độ chênh lệch. Tập hợp giá trị chênh lệch của tất cả các điểm trong ảnh tạo thành bản đồ chênh lệch. Bản đồ chênh lệch này về cơ bản có thể chuyển đổi thành bản đồ độ sâu của cảnh quan sát nếu được cung cấp thêm các thông tin về tiêu cự của máy ảnh, khoảng cách giữa hai máy ảnh trái và phải. Do đó, các bản đồ chênh lệch đã được sử dụng để giải quyết các vấn đề hiệu quả như tái tạo 3D, định vị, điều hướng rô-bốt di động, tránh chướng ngại vật [43], [44].
Hệ thống tìm bản đồ chênh lệch từ cặp ảnh nổi thường bao gồm bốn bước chính như hình 1.2.
Hình 1.2. Hệ thống tính bản đồ chênh lệch điển hình
Bước đầu, các hình ảnh đầu vào được chuẩn hóa để cho phép bù sự lệch các thông số của hai máy ảnh hoặc các điều kiện trắc quang khác nhau. Bước 2, các hình ảnh sau chuẩn hóa được tìm sự tương đồng theo các thuật tốn khác nhau. Có ba loại kỹ thuật được sử dụng rộng rãi để tìm điểm giống nhau trong cặp ảnh nổi gồm phương pháp dựa trên khu vực [39], [40], phương pháp dựa trên đặc trưng [41] và phương pháp dựa trên pha [42]. Các phương pháp dựa trên khu vực gồm thuật toán Tổng sai lệch tuyệt đối (SAD), Tổng sai lệch bình phương (SSD) hoặc Tương quan chéo chuẩn (NCC). Bước 3 là nâng cao độ tin cậy của đối tượng phù hợp bằng các phương pháp kiểm tra độ khác biệt và độ sắc nét. Ngồi ra, bước này cũng có thể sử dụng bản đồ phương sai được tính tốn trong bước 1 tiền xử lý để loại bỏ các kết quả khớp được tìm thấy ở các khu vực có kết cấu kém. Bước cuối cùng thực hiện sàng lọc điểm phụ theo độ chênh lệch.
Triển khai dựa trên thuật toán SAD là các kỹ thuật dựa trên khu vực thuận lợi bởi vì chúng có thể được triển khai một cách đơn giản trên phần cứng bởi thuật toán chỉ gồm các phép cộng và giá trị tuyệt đối. Có thể thiết kế song song để xử lý các phạm vi chênh lệch khác nhau, để giảm thời gian tính tốn cần thiết [45]. Thuật tốn tương quan SAD có thể được áp dụng để giải quyết vấn đề phát hiện đối tượng tự động trong điều khiển và lập bản đồ cho rơ-bốt (hình 1.3).
Ảnh trái Tìm sự phù hợp Bản đồ chênh lệch Ảnh phải Từ máy ảnh nổi Chuẩn hóa xám Chuẩn hóa Hiệu chỉnh Lọc
(a) (b) (c)
Hình 1.3. Kết quả tính bản đồ chênh lệch thưa thớt áp dụng thuật tốn SAD [46]. Chú thích: (a) ảnh màu; (b) ảnh biên; (c) bản đồ chênh lệch thưa thớt. Các chấm màu xanh lá cây thể hiện sự chênh lệch không đáng tin cậy.
[47] Phương pháp SAD lai (HSAD) có thể tạo ra bản đồ độ sâu có độ chính xác cao. Đầu tiên, hình ảnh được loại bỏ nhiễu, làm mịn rồi mới phân đoạn ở giai đoạn hai. Hình ảnh được chia thành các phân đoạn bằng thuật tốn Dịch trung bình (MS). Các phân đoạn nhỏ được hợp nhất với các phân đoạn liền kề giống nhau nhất bằng phương pháp Lan truyền tin cậy (BP). Cuối cùng là đề xuất tích hợp thuật tốn phân đoạn lai được với thuật toán kết hợp âm thanh nổi thu được kết quả minh họa trong hình 1.4 và bảng 1.1.
(a) (b) (c)
Hình 1.4. Kết quả thử nghiệm trên bốn hình ảnh thang độ xám thử nghiệm [47] Chú thích: a) Ảnh Books tham chiếu, b) Bản đồ chênh lệch sử dụng thuật tốn SAD mà khơng phân đoạn, c) Bản đồ chênh lệch của thuật toán lai HSAD
Bảng 1.1. Sai số của phương pháp [47]
Thuật tốn SAD khơng phân mảnh HSAD
Sai số 9,65 % 4,13 %
Kết quả nghiên cứu cho thấy thuật tốn tương quan SAD có thể là một sự thay thế tiềm năng cho phương pháp Biến đổi đặc trưng tỷ lệ bất biến (SIFT) do [48] [49]
đề xuất trong bài tốn chọn lọc mang tính bước ngoặt. Mục đích của phương pháp SIFT là xác định được phép biến đổi gồm các thành phẩn như phép tỷ lệ liên tục, phép xoay và di chuyển. Nhưng giải thuật chỉ giới hạn với những lựa chọn các đặc tính ổn định thì tỏ ra hiệu quả hơn. Thơng thường, độ chênh lệch được tính như độ dịch chuyển sang bên trái của đặc điểm hình ảnh khi nó được xem với hình ảnh bên phải. Việc tính tốn bản đồ chênh lệch được thực hiện trên tất cả các điểm ảnh của cặp ảnh nổi nên cách tiếp cận này có thể bị ảnh hưởng bởi vị trí của đối tượng và thời gian trôi qua lớn để xác định điểm tương ứng giữa hai hình ảnh, đặc biệt với kích thước lớn của hình ảnh hoặc khung hình đã chụp.