Mô hình OBN-SBN và OBN-HSBN

Một phần của tài liệu Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh (Trang 68 - 69)

Tỉ lệ nhận dạng đối tượng trong ảnh hai đối tượng cho kết quả không cao. Lý do vì những ảnh tạo ra do vị trí, tức tạo ra từ việc dịch chuyển quanh trọng tâm chưa đủ gần đối với những đối tượng được học tại đây. Vì vậy, khi một tấm ảnh được đưa vào mô hình, giá trị niềm tin của nó không cao. Chìa khóa để giải quyết vấn đề này là chúng tôi đề nghị thay đổi cách thức hiện thời tạo ảnh. Đó là, ứng với mỗi đặc trưng theo thời gian của đối tượng, chúng tôi tiếp tục dịch chuyển nó tại trọng tâm trong một bán kính định trước. Sau đó những ảnh tạo ra mới này sẽ được huấn luyện bới mạng HTM. Khi đó, có thể niềm tin trả ra khi nhận dạng đối tượng sẽ cao hơn.

Mỗi đối tượng hiện thời gắn liền với một mạng HSBN. Mạng này đóng vai trò nhận diện đối tượng, nó minh họa luồn điều khiển bottom-up và top-down trong tập trung thị giác. Cụ thể, một đối tượng có nhiều bộ phận thì sự nhận diện chỉ trên một tập các bộ phận đặc trưng kết hợp trong không gian và được giám sát dưới tri thức bổ sung của con người. Trong mô hình OBN-HSBN, mạng HSBN hầu như được tạo ra dựa trên sự giả định của tác giả về một đối tượng cụ thể nên không phù hợp cho một họ đối tượng. Vì vậy, việc tạo ra một mạng HSBN chung tổng quan áp dụng cho tất các các loại đối tượng khác nhau cùng họ là một bước kế tiếp cần nghiên cứu.

Mạng HTM có thể được dùng để nhận dạng các đối tượng được huấn luyện. Tuy nhiên, nếu kích thước của đối tượng bị co giãn như là lớn hơn hoặc nhỏ hơn kích thước ban đầu thì mạng không thể nhận diện chính xác được. Giải pháp đưa ra là chúng tôi đề nghị tạo nhiều mô hình mạng HTM dựa vào kích thước (size-created HTM networks) theo độ phân giải của ảnh. Khi một đối tượng ảnh đưa vào hệ thống, nó sẽ được đưa qua

hệ thống mạng HTM theo kích thước để kiểm tra xem đối tượng hiện thời đang được co giãn trong khoản nào.

Chúng tôi cho rằng một đối tượng hay bộ phận được xem như có nhiều đối tượng và bộ phận con bên trong nó. Chúng tôi đề nghị một cách thức nhận dạng đối tượng mới. Hệ thống đầu tiên sẽ đi nhận dạng các đối tượng/bộ phận con bên trong trước thay vì nhận dạng cả đối tượng và bộ phận lớn. Hệ thống này phù hợp với việc nhận dạng đối tượng có ảnh lồng nhau. Giá trị nhận dạng từ tầng thấp, ở đối tượng / bộ phận con, sẽ được truyền lên ở tầng cao hơn, ở đối tượng / bộ phận ngoài. Khi đó chúng tôi đề nghị sử dụng thêm một mạng tri thức để phán đoán các đối tượng / bộ phận kế tiếp. Hệ thống hoạt động này được đặt tên là hệ thống nhận dạng đa phân cấp (multi-layer object identification system).

Một phần của tài liệu Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh (Trang 68 - 69)