4. Cấu trúc nội dung của luận án
2.2.3. Nguyên lý thị giác nổi
Nguyên lý thị giác nổi giống như tầm nhìn hai mắt của con người và nhận thức trực quan của chúng ta về độ sâu, nơi mà các vật ở xa hơn trong cảnh thì vị trí của chúng ít thay đổi khi chúng ta nhắm mắt luân phiên. Đây là tính chất trong hệ thống thị giác nổi: các vật nằm xa tương ứng có một sự khác biệt (còn gọi là độ chênh lệch) nhỏ hơn giữa hai hình ảnh nổi; các vật nằm ở gần thì có sự khác biệt lớn về vị trí giữa cặp hình ảnh nổi. Theo [77], q trình phân tích hình ảnh nổi bao gồm 5 bước sau: thu thập hình ảnh, mơ hình hóa máy ảnh, trích xuất đặc trưng, kết hợp hình ảnh và xác định chiều sâu. Trong các bước trên thì quá trình kết hợp là bước quan trọng vì nó quyết định đến chất lượng kết quả chiều sâu, được mô tả dưới đây.
Để làm được điều này, hệ thống bao gồm hai máy ảnh cách nhau bởi một khoảng cách nhất định, đường cơ sở (T), xem Hình 2.2, để có được hai khung cảnh khác nhau, giống như tầm nhìn hai mắt của con người. Quá trình kết hợp là quá trình xác định đặc trưng hoặc điểm giống nhau trong cả hai hình ảnh và tính sự khác biệt về vị trí của tập hợp các đặc trưng hoặc điểm này. Sự khác biệt vị trí thường của một đặc trưng trong hai ảnh thường là theo trục ngang. Kết quả Learning OpenCVcó được một tập đặc trưng hoặc chênh lệch tương ứng. Chênh lệch được định nghĩa là phép trừ, từ hình ảnh trái sang phải, của các tọa độ 2D của các điểm tương ứng trong khơng gian hình ảnh.
Hình 2.2. Các trục tọa độ của hệ thống thị giác nổi [78].
Chú thích: (cx, cy) là điểm trung tâm ảnh. pl và pr là tọa độ của điểm p trong ảnh trái và ảnh phải, tương ứng.
Kết quả của quá trình kết hợp thu được thơng tin độ sâu tương đối. Nó có tỷ lệ nghịch với khoảng cách đến các đối tượng vì chiều sâu tỷ lệ nghịch với sự chênh lệch. Hai thơng số này rõ ràng là có một mối quan hệ phi tuyến. Khi chênh lệch gần 0, sự
khác biệt chênh lệch nhỏ lại tạo ra sự thay đổi khoảng cách lớn. Khi độ chênh lệch lớn, sự thay đổi chênh lệch nhỏ sẽ không thay đổi nhiều về khoảng cách. Hệ quả là các hệ thống thị giác nổi có độ phân giải cao chỉ đối với các đối tượng tương đối gần máy ảnh (Hình 2.3).
(a) (b)
Hình 2.3. Mối quan hệ tỷ lệ nghịch độ sâu và độ chênh lệch [78]
Chú thích: (a): Hệ máy ảnh nối. (b): Quan hệ giữa khoảng cách và độ chênh lệch
Độ sâu có thể được thiết lập bằng cách tam giác các chênh lệch thu được, với điều kiện vị trí trung tâm của chiếu, độ dài tiêu cự và hướng của trục quang được biết đến. Độ dài tiêu cự f, thường được biểu diễn bằng milimét (mm), là mơ tả cơ bản của một ống kính nhiếp ảnh. Nó khơng phải là phép đo chiều dài thực tế của ống kính, nhưng tính khoảng cách quang học từ điểm mà các tia sáng tập trung để hình thành một hình ảnh sắc nét của một đối tượng tới cảm biến số hoặc phim 35mm ở mặt phẳng tiêu cự trong máy ảnh. Độ dài tiêu cự của ống kính được xác định khi ống kính tập trung ở vơ cực. Độ dài tiêu cự càng dài, góc nhìn càng hẹp và độ phóng đại càng cao và ngược lại. Đường thẳng từ trung tâm máy ảnh vng góc với mặt phẳng hình ảnh được gọi là trục chính hoặc trục quang của máy ảnh. Mặt phẳng song song với mặt phẳng hình ảnh có chứa trung tâm quang học được gọi là mặt phẳng chính hoặc mặt phẳng tiêu cự của máy ảnh. Mối quan hệ giữa các tọa độ 3D của một điểm trong cảnh và tọa độ của hình chiếu của nó lên mặt phẳng ảnh được mơ tả bằng phép chiếu trung tâm hoặc góc tọa độ.
Do đó, tọa độ của điểm trong hệ thống tham chiếu máy ảnh có thể được tính như là (X ', Y', Z’) cho máy ảnh đầu tiên và (X. Y, Z) cho máy ảnh thứ hai. Độ sâu z có thể
được tính bằng cách kết hợp các biểu thức (2.1) để có biểu thức (2.2) khi biết các thơng số nội tại của máy ảnh như độ dài tiêu cự f, đường cơ sở máy ảnh T, và kích thước điểm
𝛾. 𝑥′ = 𝑓𝑋 ′ 𝑍 ; 𝛾. 𝑥 = 𝑓 𝑋 𝑍 (2.1) 𝑧 = 𝑓(𝑋 ′− 𝑋) 𝛾(𝑥′− 𝑥)