Lý thuyết tổng hợp đặc trưng

Một phần của tài liệu Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh (Trang 33 - 34)

Trong lĩnh vực tâm lý học có rất nhiều lý thuyết và mô hình khác nhau về tập trung thị giác. Mục đích của chúng là giải thích và hiểu hơn về nhận thức con người. Trong phạm vi luận văn, chúng tôi giới thiệu lý thuyết tổng hợp đặc trưng (Feature Integration Theory - FIT), một lý thuyết có sự ảnh hưởng lớn trong lĩnh vực tập trung thị giác. Lý thuyết này được giới thiệu vào năm 1980 do Treisman và Gelade.

Lý thuyết tổng hợp đặc trưng nêu rằng “những đặc trưng khác nhau được đăng kí sớm, tự động và song song trong trường thị giác trong khi các đối tượng được nhận dạng riêng lẻ và tại giai đoạn sau mà khi đó yêu cầu sự tập trung” [17]. Những đặc trưng thị giác đầu tiên được tính toán thành tập bản đồ đặc trưng địa lý; sự cạnh tranh không gian tạo đặc trưng cho các vị trí kích hoạt; những bản đồ đặc trưng này sau đó kết hợp lại trong một bản đồ duy nhất siêu đặc trưng (saliency map). Cuối cùng, bản đồ siêu đặc trưng này được quét qua bởi sự tập trung hội tụ thông qua chiến lược winner-take-all (dò tìm điểm có đặc trưng cao nhất tại bất kì thời điểm nào) và IOR (Inhebit Of Return- dừng vị trí tập trung cuối cùng trong bản đồ, để sự tập trung có thể hội tụ tại vị trí có đặc trưng cao nhất kế tiếp) [8]. Hay nói cách khác, bản đồ siêu đặc trưng chỉ ra trong vùng thấy đối tượng “Ở đâu” (Where) nhưng không chỉ đó là vật “gì” (What); việc quét tuần tự bản đồ tạo sự tập trung lên những vùng được chọn và cung cấp dữ liệu này cho các tác vụ nhận thức cao hơn [6].

Hầu hết các mô hình tập trung thị giác bottom-up đều dựa vào siêu bản đồ đặc trưng để xây dựng hệ thống. Hình 4-3 minh họa lược đồ của mô hình chuẩn để điều khiển sự tập trung theo mô hình bottom-up.

Hình 4-3: Lược đồ mô hình chuẩn điều khiển sự tập trung bottom-up

Mặc dù một kiến trúc máy tính đơn giản có thể hiện sự tập trung trong khoản thời gian một vài phần trăm của giây sau mỗi thể hiện cho một ngữ cảnh mới, rõ ràng một mô hình tập trung hoàn chỉnh cần bao gồm mô hình top-down, đưa tri thức vào trong quá trình xử lý tập trung.

Một phần của tài liệu Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh (Trang 33 - 34)