Vậy nhiệm vụ của chỉnh sửa ảnh là biến đổi ảnh sao cho các đường epipolar song song với nhau theo chiều ngang (hình 2.12). Nhiều phương pháp chỉnh sửa ảnh đã
được biết đến. Phương pháp chỉnh sửa ảnh phẳng (planar rectification) [16,17] dùng một biến đổi tuyến tính đơn trên mỗi ảnh đầu vào, xoay các camera sao cho các mặt phẳng ảnh giống nhau. Phương pháp này đơn giản, nhanh chóng và bảo toàn một số đặc trưng của ảnh như các đường thẳng. Tuy nhiên, phương pháp này có thể cho ảnh kết quả quá lớn, bị bóp méo và không “đóng” (unbounded). Kĩ thuật chỉnh sửa ảnh trục (cylindrical rectification) [20] sử dụng các biến đổi riêng biệt cho mỗi đường epipolar. Tuy nhiên kĩ thuật này quá phức tạp và các toán tử cần
được tính toán trong không gian 3 chiều. Các thuật toán chỉnh sửa ảnh khác nhau
được đưa ra trong các bài giảng (Ayache and Lustman, 1991; Fusiello et al ., 2000; Hartly, 1999; Robert et al., 1995; Mulligan and Kanillidis, 2000; Isgro and Trucco, 1999). Hầu hết các thuật toán đều sử dụng phép biến đổi thuần nhất.
Đề tài này sử dụng phương pháp đề xuất bởi Marc Pollefeys [8]. Biến đổi hai
ảnh sao cho các đường epipolar của hai ảnh trùng nhau. Sau đó tiến hành biến đổi
ảnh sang tọa độ cực sao cho các đường epipolar song song với nhau và song song với đường cơ bản.
Hình 2.12. Chỉnh sửa ảnh
2.2.6. Khôi phục độ sâu
Độ chênh lệch
Độ lệch thị giác (vision disparity): là sự khác biệt giữa hai ảnh trên võng mạc của mắt khi quan sát đối tượng. Điều này xảy ra vì hai mắt ở vị trí khác nhau cho nên mặc dù quan sát cùng một đối tượng nhưng mắt trái không thu nhận cùng một thông tin như mắt phải [24].
Bản đồ chênh lệch của ảnh sau khi chỉnh sửa:
Chỉnh sửa ảnh tạo ra các ảnh mới có các đường epipolar song song với nhau và song song với đường cơ bản dựa trên ràng buộc epipolar. Tiến hành đối sánh trên
ảnh chỉnh sửa làm cho không gian tìm kiếm điểm đối sánh giảm từ 2 chiều xuống 1 chiều.
Nếu m1(u1,v1) thuộc ảnh thứ nhất, thì điểm tương ứng trên ảnh thứ hai là m2(u2,v2), tuy nhiên, đối với cặp ảnh đã được chỉnh sửa, với m1(u1,v1) thì điểm đối sánh tương
ứng sẽ là m2(u2,v1). Độ chênh lệch d được định nghĩa như sau d=u2-u1(hình 1.13). L là độ dài của đường cơ bản CC’. Z là độ sâu của điểm 3 chiều (khoảng cách tính từ điểm 3 chiều đến đường cơ bản). f là tiêu cự của camera (khoảng cách từ mặt
phẳng ảnh đến đường cơ bản). Hai mặt phẳng ảnh song song với đường cơ bản vì
ảnh đã được chỉnh sửa.
Dựa vào các quan hệ hình học của các đại lượng nêu trên, ta có được mối liên hệ
giữa độ sâu và độ chênh lệch theo công thức toán học sau:
d f L Z
=
Tuy nhiên nếu sử dụng công thức này trong tính toán độ sâu thì ta cần biết đại lượng L độ dài của đường cơ bản. Hay nói cách khác biết vị trí của hai camera khi chụp 2 ảnh đầu vào.