Các mô hình tập trung thị giác nhận dạng đối tượng

Một phần của tài liệu Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh (Trang 34 - 37)

Hiện nay, có nhiều mô hình áp dụng sự tập trung thị giác vào nhận dạng đối tượng như:

 Mô hình MORSEL [18] do Mozer và Sitton đề xuất, trong đó sự chọn lựa tập trung được thể hiện cần thiết cho nhận dạng đối tượng. Mô hình này ứng dụng trong nhận dạng kí tự được xử lý thông qua một cây phân cấp nhận dạng.

 Mô hình dịch chuyển không gian do Schill và các đồng nghiệp đề xuất [19]. Mô hình này áp dụng sự tập trung theo bottom-up và top-down trong nhận dạng đối

tượng như Hình 4-4. Cụ thể, mô hình này nhận dạng đối tượng bằng sự tập trung di chuyển mắt đến những vùng của đối tượng chứa nhiều thông tin nhằm tránh nhận dạng mơ hồ. Một cây phân cấp ngữ nghĩa được xây dựng trong quá trình huấn luyện. Nút lá thể hiện các đối tượng được nhận dạng, những nút trung gian thể hiện lớp đối tượng trừu tượng tổng quan. Trong quá trình nhận dạng, hệ thống lập trình bước dịch chuyển kế tiếp của mắt sao cho có thể thu được nhiều thông tin về đối tượng dựa vào phán đoán của cây tri thức.

 Rybak và những đồng nghiệp đưa ra mô hình tương tự, trong đó con đường quét scanpaths (điều khiển sự định hướng được lưu trữ trong vùng nhớ “Ở đâu” và đặc trưng nhận dạng đối tượng bottom-up được lưu trữ trong vùng nhớ “Cái gì”) được huấn luyện cho mỗi ngữ cảnh và đối tượng được nhận dạng. Khi một tấm ảnh được đưa vào, mô hình chọn lựa những scanpath ứng viên bằng cách so khớp đặc trưng bottom-up trong tấm ảnh với những gì được huấn luyện trong vùng nhớ “Cái gì”. Với mỗi ứng viên scanpath, mô hình sử dụng sự tập trung dựa theo định hướng trong vùng nhớ “Ở đâu” và so sánh nội dung đặc trưng của vùng đó trong ảnh thật với nội dung vùng nhớ “Cái gì”. Mô hình này có thể nhận dạng ảnh xám, sự biến dạng, ảnh xoay và co giãn.

Hình 4-4: Mô hình tập trung nhận dạng đối tượng bằng dịch chuyển không gian

4.4 Kết luận

Trong chương này, chúng tôi trình bày lý thuyết tập trung thị giác của con người. Cụ thể, chúng tôi trình bày định nghĩa của sự tập trung, các yếu tố tạo nên sự tập trung bao gồm tính hướng đối tượng và hướng không gian trong sự tập trung được tạo bởi hai nhân tố bottom-up vào top-down. Đối với bottom-up, sự tập trung dựa vào bản đồ siêu đặc trưng. Ngược lại đối với top-down, sự tập trung dựa vào tri thức, mục đích hiện thời,.. mang trạng thái bên trong của hệ thống thể hiện.

Bên cạnh đó, chúng tôi giới thiệu các mô hình tin học hóa sự tập trung thị giác trong nhận dạng đối tượng. Vì thế, chúng tôi tin rằng việc áp dụng HTM trong mô hình hóa sự tập trung bottom-up và top-down là một hướng đi mới được trình bày trong chương kế tiếp.

Chương 5

Đề xuất mô hình tập trung thị giác máy tính

Một phần của tài liệu Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh (Trang 34 - 37)