Sự thể hiện không gian tỷ lệ

Một phần của tài liệu Điểm bất động và ứng dụng trong nhận dạng đối tượng (Trang 25)

Một đặc tính vốn có của các đối tượng thế giới thực là chúng tồn tại như các thực thể đầy ý nghĩa trên khắp các tỷ lệ khác nhau. Một ví dụ đơn giản là khái niệm một nhánh cây, nó chỉ có nghĩa ở tỷ lệ từ một vài centimet tới nhiều nhất là vài mét, vì vậy thật vô nghĩa khi thảo luận khái niệm “cây” ở mức nanomet hoặc kilomet. Với cơ sở lập luận này, thì các đối tượng trong thế giới xuất hiện theo các cách khác nhau tùy thuộc tỷ lệ quan sát nếu người ta nhằm vào việc mô tả chúng. Vì vậy khái niệm tỷ lệ là cực kỳ quan trọng.

Đặc biệt, sự cần thiết đối với việc thể hiện đa tỷ lệ nảy sinh khi thiết kế các phương pháp phân tích tự động và thu nhận thông tin từ các phép đo thế giới thực. Để có thể trích chọn bất kỳ thông tin nào từ dữ liệu ảnh, rõ ràng người ta phải

tương tác với dữ liệu ảnh bằng cách sử dụng các toán tử nào đó. Kiểu thông tin có thể thu được phần lớn được xác định bởi mối quan hệ giữa kích thước của các cấu trúc hiện thực trong dữ liệu đó và kích thước của các toán tử. Vài vấn đề rất cơ bản trong xử lý ảnh tập trung vào toán tử nào được dùng, nơi áp dụng chúng và chúng ở phạm vi như thế nào. Nếu các vấn đề này không được quan tâm thích đáng thì việc giải thích cho sự đáp ứng của toán tử có thể rất khó khăn.

Tuy nhiên, trong các hoàn cảnh khác nhau có thể không là hiển nhiên để xác định trước tỷ lệ nào là thích hợp. Một ví dụ cho trường hợp như vậy là hệ thống thị giác với nhiệm vụ phân tích các cảnh chưa biết. Bên cạnh các đặc tính đa tỷ lệ vốn có của các đối tượng thế giới thực, thì một hệ thống như vậy phải đối mặt với các vấn đề như phép ánh xạ theo luật gần xa đưa đến các thay đổi về kích thước, tạp nhiễu cũng bị đưa vào trong quá trình thu nhận ảnh, và dữ liệu sẵn có là các tập dữ liệu hai chiều phản ánh các đặc tính gián tiếp của một thế giới 3 chiều. Để có thể đối phó với các vấn đề này, một công cụ cần thiết là một lý thuyết hình thức cho cách mô tả các cấu trúc ảnh ở các tỷ lệ khác nhau.

* Sự thể hiện không gian tỷ lệ:

Hình 2.1. Một thể hiện đa tỷ lệ của một tín hiệu là một tập có thứ tự của các tín hiệu thu nhận đƣợc dự định để thể hiện tín hiệu gốc ở các mức tỷ lệ khác nhau.

Lý thuyết không gian tỷ lệ [6] là một framework cho các thao tác thị giác gần đây, lý thuyết này được phát triển bởi cộng đồng thị giác máy tính để xử lý bản chất đa tỷ lệ được đề cập ở trên của dữ liệu ảnh. Một vấn đề chính đằng sau cấu trúc của nó là nếu không cho trước thông tin về các tỷ lệ thích hợp đối với một tập dữ liệu cho trước thì chỉ có một phương pháp duy nhất cho hệ thống thị giác không ràng buộc là thể hiện dữ liệu vào ở nhiều mức tỷ lệ khác nhau. Điều này có nghĩa là tín hiệu gốc nên được nhúng vào một họ một tham số của các tín

hiệu thu nhận, ở đó các cấu trúc có tỷ lệ nhỏ được nén liên tiếp (Hình 2.1). Một ý tưởng như vậy nên được thực hiện như thế nào trong thực tế? Một yêu cầu cốt yếu là các cấu trúc ở các tỷ lệ thô trong một thể hiện đa tỷ lệ sẽ là các sự đơn giản hóa của các cấu trúc tương ứng ở các tỷ lệ nhỏ hơn. Tóm lại, đối với bất kỳ tín hiệu n chiều nào f: RNR, thì một thể hiện không gian tỷ lệ của nó L: RNR+  R được định nghĩa bởi công thức sau:

R

( ; ) N ( ) ( )

L x t f x g d

   

 

ở đó g: RNR+ R biểu thị nhân Gaussian, trong đó biến t được xem là tham số tỷ lệ 2 2 1 ( )/ 2 2 / 2 1 ( ; ) (2 ) D x x t D g x t e      

Với điều kiện ban đầu L(.; t) = f. Khi đó, dựa vào thể hiện này, các đạo hàm không gian tỷ lệ ở bất kỳ tỷ lệ t nào đều được xác định bởi:

1 1 1 ... 1 ... ( ; ) D ( ; ) ( D ( ; )) D D x x x x x L   t     L t     gtf

Hình 2.2. Các mức khác nhau trong một thể hiện không gian tỷ lệ của một ảnh hai chiều ở các mức tỷ lệ t = 0, 2, 8, 32, 128 và 512 cùng với các hình giọt nƣớc mức xám biểu thị các giá trị cực tiểu cục bộ ở mỗi tỷ lệ.

Hình 2.2 thể hiện một ví dụ ứng với một ảnh hai chiều. Ở đây, để nhấn mạnh các biến đổi cục bộ trong một ảnh cấp xám, các giá trị cực tiểu cục bộ

trong các ảnh cấp xám ở mỗi tỷ lệ được biểu thị bởi các hình giọt nước màu đen. Chúng ta có thể thấy rằng phần lớn các hình giọt nước nhỏ là do tạp nhiễu và kết cấu được phát hiện ở các tỷ lệ nhỏ. Sau khi làm trơn, các nút bấm trên bàn phím hiện ra rõ ràng hơn, trong khi đó ở các tỷ lệ lớn hơn các nút này hợp thành một khối. Hơn nữa, các cấu trúc ảnh tối hơn (như máy tính, dây, và ống nghe điện thoại) xuất hiện như các hình giọt nước đơn ở các tỷ lệ lớn hơn. Ví dụ này minh họa cho các kiểu phân tích hình dạng có thứ bậc mà các phân tích này có thể được đạt đến bằng việc thay đổi tham số tỷ lệ trong thể hiện không gian tỷ lệ đó. Các mối liên hệ giữa các cấu trúc ảnh ở các tỷ lệ khác nhau được tạo ra theo cách này được gọi là các cấu trúc theo độ sâu (deep structures).

Một phần của tài liệu Điểm bất động và ứng dụng trong nhận dạng đối tượng (Trang 25)

Tải bản đầy đủ (PDF)

(68 trang)