Một đặc tính vốn có của các đối tƣợng thế giới thực là chúng tồn tại nhƣ các thực thể đầy ý nghĩa trên khắp các tỷ lệ khác nhau. Một ví dụ đơn giản là khái niệm một nhánh cây, nó chỉ có nghĩa ở tỷ lệ từ một vài centimet tới nhiều nhất là vài mét, vì vậy thật vô nghĩa khi thảo luận khái niệm “cây” ở mức nanomet hoặc kilomet. Với cơ sở lập luận này, thì các đối tƣợng trong thế giới xuất hiện theo các cách khác nhau tùy thuộc tỷ lệ quan sát nếu ngƣời ta nhằm vào việc mô tả chúng. Vì vậy khái niệm tỷ lệ là cực kỳ quan trọng.
Đặc biệt, sự cần thiết đối với việc thể hiện đa tỷ lệ nảy sinh khi thiết kế các phƣơng pháp phân tích tự động và thu nhận thông tin từ các phép đo thế giới thực. Để có thể trích chọn bất kỳ thông tin nào từ dữ liệu ảnh, rõ ràng ngƣời ta phải tƣơng tác với dữ liệu ảnh bằng cách sử dụng các toán tử nào đó. Kiểu thông tin có thể thu đƣợc phần lớn đƣợc xác định bởi mối quan hệ giữa kích thƣớc của các cấu trúc hiện thực trong dữ liệu đó và kích thƣớc của các toán tử. Vài vấn đề rất cơ bản trong xử lý ảnh tập trung vào toán tử nào đƣợc dùng, nơi áp dụng chúng và chúng ở phạm vi nhƣ thế nào. Nếu các vấn đề này không đƣợc quan tâm thích đáng thì việc giải thích cho sự đáp ứng của toán tử có thể rất khó khăn.
Tuy nhiên, trong các hoàn cảnh khác nhau có thể không là hiển nhiên để xác định trƣớc tỷ lệ nào là thích hợp. Một ví dụ cho trƣờng hợp nhƣ vậy là hệ thống thị giác với nhiệm vụ phân tích các cảnh chƣa biết. Bên cạnh các đặc tính đa tỷ lệ vốn có của các đối tƣợng thế giới thực, thì một hệ thống nhƣ vậy phải đối mặt với các vấn đề nhƣ phép ánh xạ theo luật gần xa đƣa đến các thay đổi về kích thƣớc, tạp nhiễu cũng bị đƣa vào trong quá trình thu nhận ảnh, và dữ liệu sẵn có là các tập dữ liệu hai chiều phản ánh các đặc tính gián tiếp của một thế giới 3 chiều. Để có thể đối phó với các vấn đề này, một công cụ cần thiết là một lý thuyết hình thức cho cách mô tả các cấu trúc ảnh ở các tỷ lệ khác nhau.
* Sự thể hiện không gian tỷ lệ: định nghĩa và các ý tƣởng cơ bản
Hình 2.5. Một thể hiện đa tỷ lệ của một tín hiệu là một tập có thứ tự của các tín hiệu thu nhận được dự định để thể hiện tín hiệu gốc ở các mức tỷ lệ khác nhau.
Lý thuyết không gian tỷ lệ là một nền tảng cho các thao tác thị giác gần đây, lý thuyết này đƣợc phát triển bởi cộng đồng thị giác máy tính để xử lý bản chất đa tỷ lệ đƣợc đề cập ở trên của dữ liệu ảnh. Một vấn đề chính đằng sau cấu trúc của nó là nếu không cho trƣớc thông tin về các tỷ lệ thích hợp đối với một tập dữ liệu cho trƣớc thì chỉ có một phƣơng pháp duy nhất cho hệ
thống thị giác không ràng buộc là thể hiện dữ liệu vào ở nhiều mức tỷ lệ khác nhau. Điều này có nghĩa là tín hiệu gốc nên đƣợc nhúng vào một họ một tham số của các tín hiệu thu nhận, ở đó các cấu trúc có tỷ lệ nhỏ đƣợc nén liên tiếp (Hình 2.5). Một ý tƣởng nhƣ vậy nên đƣợc thực hiện nhƣ thế nào trong thực tế? Một yêu cầu cốt yếu là các cấu trúc ở các tỷ lệ thô trong một thể hiện đa tỷ lệ sẽ là các sự đơn giản hóa của các cấu trúc tƣơng ứng ở các tỷ lệ nhỏ hơn. Tóm lại, đối với bất kỳ tín hiệu n chiều nào f: RNR, thì một thể hiện không gian tỷ lệ của nó L: RNR+ R đƣợc định nghĩa bởi công thức sau:
R ( ; ) N ( ) ( ) L x t f x g d
ở đó g: RNR+ R biểu thị hàm nhân Gaussian.
2 2 1 ( )/ 2 2 / 2 1 ( ; ) (2 ) D x x t D g x t e
Biến t đƣợc xem là tham số tỷ lệ. Tƣơng đƣơng, họ không gian tỷ lệ có thể đƣợc đạt đến nhƣ một giải pháp cho phƣơng trình tuyến tính:
2 1 2
tL L
Với điều kiện ban đầu L(.; t) = f. Khi đó, dựa vào thể hiện này, các đạo hàm không gian tỷ lệ ở bất kỳ tỷ lệ t nào đều đƣợc xác định bởi:
1 1 1 ... 1 ... ( ; ) D ( ; ) ( D ( ; )) D D x x x x x L t L t g t f
Hình 2.6. Các mức khác nhau trong một thể hiện không gian tỷ lệ của một ảnh hai chiều ở các mức tỷ lệ t = 0, 2, 8, 32, 128 và 512 cùng với các hình giọt nước mức xám biểu thị các giá trị cực tiểu cục bộ ở mỗi tỷ lệ.
Hình 2.6 thể hiện một ví dụ ứng với một ảnh hai chiều. Ở đây, để nhấn mạnh các biến đổi cục bộ trong một ảnh cấp xám, các giá trị cực tiểu cục bộ trong các ảnh cấp xám ở mỗi tỷ lệ đƣợc biểu thị bởi các hình giọt nƣớc màu đen. Chúng ta có thể thấy rằng phần lớn các hình giọt nƣớc nhỏ là do tạp nhiễu và kết cấu đƣợc phát hiện ở các tỷ lệ nhỏ. Sau khi làm trơn, các nút bấm trên bàn phím hiện ra rõ ràng hơn, trong khi đó ở các tỷ lệ lớn hơn các nút này hợp thành một khối. Hơn nữa, các cấu trúc ảnh tối hơn (nhƣ máy tính, dây, và ống nghe điện thoại) xuất hiện nhƣ các hình giọt nƣớc đơn ở các tỷ lệ lớn hơn. Ví dụ này minh họa cho các kiểu phân tích hình dạng có thứ bậc mà các phân tích này có thể đƣợc đạt đến bằng việc thay đổi tham số tỷ lệ trong thể hiện không gian tỷ lệ đó. Các mối liên hệ giữa các cấu trúc ảnh ở các tỷ lệ khác nhau đƣợc tạo ra theo cách này đƣợc gọi là các cấu trúc theo độ sâu (deep structures).