1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh

111 256 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 111
Dung lượng 3,01 MB

Nội dung

[...]... tri thức vào trong quá trình xử lý tập trung 4.3 Các mô hình tập trung thị giác nhận dạng đối tượng Hiện nay, có nhiều mô hình áp dụng sự tập trung thị giác vào nhận dạng đối tượng như:  Mô hình MORSEL [18] do Mozer và Sitton đề xuất, trong đó sự chọn lựa tập trung được thể hiện cần thiết cho nhận dạng đối tượng Mô hình này ứng dụng trong nhận dạng kí tự được xử lý thông qua một cây phân cấp nhận dạng... Schill và các đồng nghiệp đề xuất [19] Mô hình này áp dụng sự tập trung theo bottom-up và top-down trong nhận dạng đối 33 tượng như Hình 4-4 Cụ thể, mô hình này nhận dạng đối tượng bằng sự tập trung di chuyển mắt đến những vùng của đối tượng chứa nhiều thông tin nhằm tránh nhận dạng mơ hồ Một cây phân cấp ngữ nghĩa được xây dựng trong quá trình huấn luyện Nút lá thể hiện các đối tượng được nhận dạng,... bottom-up được lưu trữ trong vùng nhớ “Cái gì”) được huấn luyện cho mỗi ngữ cảnh và đối tượng được nhận dạng Khi một tấm ảnh được đưa vào, mô hình chọn lựa những scanpath ứng viên bằng cách so khớp đặc trưng bottom-up trong tấm ảnh với những gì được huấn luyện trong vùng nhớ “Cái gì” Với mỗi ứng viên scanpath, mô hình sử dụng sự tập trung dựa theo định hướng trong vùng nhớ “Ở đâu” và so sánh nội dung... thể hiện lớp đối tượng trừu tượng tổng quan Trong quá trình nhận dạng, hệ thống lập trình bước dịch chuyển kế tiếp của mắt sao cho có thể thu được nhiều thông tin về đối tượng dựa vào phán đoán của cây tri thức  Rybak và những đồng nghiệp đưa ra mô hình tương tự, trong đó con đường quét scanpaths (điều khiển sự định hướng được lưu trữ trong vùng nhớ “Ở đâu” và đặc trưng nhận dạng đối tượng bottom-up... trung nhận diện có các kích thước khác nhau  Trạng thái hướng đối tượng Người ta đã tìm được những bằng chứng chứng minh sự tập trung được hướng tới các thông tin có tổ chức tương tự như một đối tượng hoặc một cấu trúc được tổ chức có logic trong môi trường Ngay cả khi các đối tượng đó bị trùng lắp lên nhau trong không gian hoặc không liên tục trong không gian Tất cả các đặc trưng của một đối tượng. .. tính hướng đối tượng và hướng không gian trong sự tập trung được tạo bởi hai nhân tố bottom-up vào top-down Đối với bottom-up, sự tập trung dựa vào bản đồ siêu đặc trưng Ngược lại đối với top-down, sự tập trung dựa vào tri thức, mục đích hiện thời, mang trạng thái bên trong của hệ thống thể hiện Bên cạnh đó, chúng tôi giới thiệu các mô hình tin học hóa sự tập trung thị giác trong nhận dạng đối tượng Vì... HTM có thể trừu tượng hóa dữ liệu khi thông tin càng được truyền lên cao dần trong mô hình phân cấp Tầng 3 Tầng 2 Tầng 1 Ảnh đầu vào Hình 3-1: Mô hình mạng HTM 22 Trong hình minh họa trên, mạng HTM gồm có 3 tầng Thông tin đi từ tầng cuối cùng Những nút trong mỗi tầng được phân bố thành hình chữ nhật Tầng trên cùng chỉ có một nút; tầng giữa có 16 nút và tầng cuối cùng có 64 nút Ảnh đầu vào có kích thước... đó trong ảnh thật với nội dung vùng nhớ “Cái gì” Mô hình này có thể nhận dạng ảnh xám, sự biến dạng, ảnh xoay và co giãn  Ngoài ra còn có các mô hình của Deco và Zihl [20], Stark và Choi [21] 34 Hình 4-4: Mô hình tập trung nhận dạng đối tượng bằng dịch chuyển không gian 4.4 Kết luận Trong chương này, chúng tôi trình bày lý thuyết tập trung thị giác của con người Cụ thể, chúng tôi trình bày định nghĩa. .. Thành Thắng (khóa K16) có tựa đề ỨNG DỤNG MÔ HÌNH TẬP TRUNG ĐỂ NHẬN DIỆN ĐỐI TƯỢNG TRONG ẢNH , đã bảo vệ tại trường ĐH KHTN TP.HCM vào 2009 Trong chương kế tiếp, chúng tôi sẽ trình bày lý thuyết tập trung thị giác liên quan đến hoạt động não bộ Từ đó, chúng tôi đề xuất xây dựng các mô hình tin học hóa lý thuyết tập trung thị giác dựa vào mô hình trí nhớ phân cấp thời gian HTM 26 Chương 4 Tập trung thị... nếu hai đối tượng không trùng lắp nhau trong không gian thì sự chính xác là ngang nhau trong hai trường hợp trên Họ kết luận rằng các yếu tố không gian không giữ vai trò gì trong quá trình diễn ra sự tập trung hướng đối tượng 30  Mối quan hệ giữa hướng đối tượng và hướng không gian Các nghiên cứu này đều công nhận rằng cả hai trạng thái của sự tập trung cùng tồn tại trong hệ thống thị giác và chúng . PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN PHẠM ANH PHƯƠNG ỨNG DỤNG MẠNG HTM VÀ MẠNG NGỮ NGHĨA ĐỂ NHẬN DIỆN ĐỐI TƯỢNG PHỨC TRONG ẢNH LUẬN VĂN THẠC SĨ NGÀNH KHOA. PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN PHẠM ANH PHƯƠNG ỨNG DỤNG MẠNG HTM VÀ MẠNG NGỮ NGHĨA ĐỂ NHẬN DIỆN ĐỐI TƯỢNG PHỨC TRONG ẢNH Ngành: KHOA HỌC MÁY TÍNH Mã số:. do đề xuất mô hình 35 5.2 Xây dựng tập ảnh, mạng HTM- SBN và HTM- OBN 38 5.2.1 Tạo tập ảnh huấn luyện và kiểm tra 38 5.2.2 Xây dựng mạng HTM- SBN và HTM- OBN 42 5.3 Mô hình OBN – SBN 44 5.3.1

Ngày đăng: 28/09/2014, 10:45

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2] J.Hawkins and S. Blakeslee, "On Intelligence", Times Books, 2004 Sách, tạp chí
Tiêu đề: On Intelligence
[3] H.B Le and T.T Tran, "Recognizing objects in images using visual attention schema", New Directions in Intelligent Interactive Multimedia Systems and Services - 2, vol.226/2009, pp. 129-144, 07/2009 Sách, tạp chí
Tiêu đề: Recognizing objects in images using visual attention schema
[6] S. Frintrop, E. Rome and H. I. Christensen, "Computational Visual Attention Systems and their Cognitive Foundations: A Survery", ACM Transactions on Applied Perception (TAP), 1/2010 Sách, tạp chí
Tiêu đề: Computational Visual Attention Systems and their Cognitive Foundations: A Survery
[7] T. Tran, “Ứng dụng mô hình tập trung để nhận diện đối tượng trong ảnh”, luận văn cao học được bảo vệ tại trường ĐHKHTN, 2009 Sách, tạp chí
Tiêu đề: Ứng dụng mô hình tập trung để nhận diện đối tượng trong ảnh
[8] L. Itti and C. Koch, "Computational Modelling of Visual Attention", Nature reviews. Neuroscience, Vol. 2, No. 3, pp. 194-203, 03/2001 Sách, tạp chí
Tiêu đề: Computational Modelling of Visual Attention
[9] M.C. Mozer and S.P. Vecera, “Object- and space-based attention”, Neurobiology of attention (pp. 130-134), 2005 Sách, tạp chí
Tiêu đề: Object- and space-based attention
[10] M. I.Posner, "Orienting of attention". Q. J. Exp. Psychol, 1980 Sách, tạp chí
Tiêu đề: Orienting of attention
[11] C. W. Eriksen and Y.-Y. Yeh, "Allocation of attention in the visual field",. J. Exp. Psychol. Hum. Percept. Perform. 11, 1985 Sách, tạp chí
Tiêu đề: Allocation of attention in the visual field
[12] J. Duncan , "Selective attention and the organization of visual information". J. Exp. Psychol. Gen. 113, 1984 Sách, tạp chí
Tiêu đề: Selective attention and the organization of visual information
[13] S. P. Vecera and M. J. Farah, "Does visual attention select objects or locations?", J. Exp. Psychol. Gen. 123, pp. 146–160, 1994 Sách, tạp chí
Tiêu đề: Does visual attention select objects or locations
[14] D. L. Gordon, "The CODE theory of Visual Attention: An Integration of Space-Based and Object-Based Attention", Psychological Review, Vol 103(4), 603-649, Oct 1996 Sách, tạp chí
Tiêu đề: The CODE theory of Visual Attention: An Integration of Space-Based and Object-Based Attention
[15] N. Lavie and J. Driver, "On the spatial extent of attention in object-based visual selection", Percept. Psychophys. 58, pp. 1238–1251, 1996 Sách, tạp chí
Tiêu đề: On the spatial extent of attention in object-based visual selection
[16] R. Desimone and J. Duncan, "Neural mechanisms of selective visual attention", Annual Reviews of Neuroscience 18, 193–222, 1995 Sách, tạp chí
Tiêu đề: Neural mechanisms of selective visual attention
[17] A. M. Treisman and G. Gelade, "A feature integration theory of attention", Cognitive Psychology 12, 97–136, 1980 Sách, tạp chí
Tiêu đề: A feature integration theory of attention
[18] M. Mozer and S.Sitton, "In Attention", (ed. Pashler, H.),pp. 341–393, 1996 Sách, tạp chí
Tiêu đề: In Attention
[19] K. Schill, E. Umkehrer, S. Beinlich, G. Krieger and C.Zetzsche, "Scene analysis with saccadic eye movements: top-down and bottom-up modeling", J. Electronic Imaging Sách, tạp chí
Tiêu đề: Scene analysis with saccadic eye movements: top-down and bottom-up modeling
[20] G. Deco and J. Zihl, "A neurodynamical model of visual attention: Feedback enhancement of spatial resolution in a hierarchical system", J. Comp. Neurosci Sách, tạp chí
Tiêu đề: A neurodynamical model of visual attention: Feedback enhancement of spatial resolution in a hierarchical system
[21] L. W. Stark and Y. S. Choi, "In Visual Attention and Cognition" (eds Zangemeister, W. H., Stiehl, H. S. & Freska, C.) 3–69 (Elsevier Science B. V., Amsterdam, 1996) Sách, tạp chí
Tiêu đề: In Visual Attention and Cognition
[22] J. Doremalen and L. Boves, “Spoken Digit Recognition using a Hierarchical Temporal Memory” Sách, tạp chí
Tiêu đề: Spoken Digit Recognition using a Hierarchical Temporal Memory
[5] Numenta, Inc. „Zeta1 Algorithms Reference‟, Version 1.5, Patents pending, http://www.numenta.com/ , 18/12/2008 Link

HÌNH ẢNH LIÊN QUAN

Hình 2-1: Một tế bào nơron cơ bản - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 2 1: Một tế bào nơron cơ bản (Trang 14)
Hình 2-3: Một sơ đồ mạng nơron đơn giản. - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 2 3: Một sơ đồ mạng nơron đơn giản (Trang 15)
Hình 2-2: Một tế bào nơron nhân tạo - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 2 2: Một tế bào nơron nhân tạo (Trang 15)
Hình 2-4: Các phân vùng hoạt động trong bộ não - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 2 4: Các phân vùng hoạt động trong bộ não (Trang 18)
Hình 2-5: Hình thành mẫu bất biến của giác gian sờ, nghe và nhìn - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 2 5: Hình thành mẫu bất biến của giác gian sờ, nghe và nhìn (Trang 20)
Hình 2-6: Thông tin lan truyền lên và xuống hình thành các mẫu phán đoán. - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 2 6: Thông tin lan truyền lên và xuống hình thành các mẫu phán đoán (Trang 21)
Hình 3-1: Mô hình mạng HTM. - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 3 1: Mô hình mạng HTM (Trang 23)
Hình 3-2: Mô hình gom nhóm không gian và thời gian của nút trong HTM. - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 3 2: Mô hình gom nhóm không gian và thời gian của nút trong HTM (Trang 24)
Hình dưới đây mô tả tổng quan hệ thống thị giác con người. - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình d ưới đây mô tả tổng quan hệ thống thị giác con người (Trang 28)
Hình 4-2: Luồn thông tin thị giác vào khu vực xử lý tín hiệu chính - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 4 2: Luồn thông tin thị giác vào khu vực xử lý tín hiệu chính (Trang 29)
Hình 4-3: Lược đồ mô hình chuẩn điều khiển sự tập trung bottom-up - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 4 3: Lược đồ mô hình chuẩn điều khiển sự tập trung bottom-up (Trang 34)
Hình 4-4: Mô hình tập trung nhận dạng đối tượng bằng - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 4 4: Mô hình tập trung nhận dạng đối tượng bằng (Trang 36)
Hình 5-1: Kiến trúc mô hình SBN-OBN - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 1: Kiến trúc mô hình SBN-OBN (Trang 38)
Hình 5-2: Một ví dụ về hướng đa và đơn bộ phận của đối tượng "Computer" - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 2: Một ví dụ về hướng đa và đơn bộ phận của đối tượng "Computer" (Trang 42)
Hình 5-3: Phương pháp quay trọng tâm trong không gian 3D - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 3: Phương pháp quay trọng tâm trong không gian 3D (Trang 42)
Hình 5-4: Xoay đối tượng "Table" quanh trọng tâm. - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 4: Xoay đối tượng "Table" quanh trọng tâm (Trang 43)
Hình 5-5: Di chuyển bộ phận “Computer” về trọng tâm và - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 5: Di chuyển bộ phận “Computer” về trọng tâm và (Trang 44)
Hình 5-6: Huấn luyện và nhận dạng các kết hợp của - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 6: Huấn luyện và nhận dạng các kết hợp của (Trang 45)
Hình 5-7: Huấn luyện và nhận dạng các bộ phận của - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 7: Huấn luyện và nhận dạng các bộ phận của (Trang 46)
Hình 5-8: Kiến trúc mô hình OBN-SBN - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 8: Kiến trúc mô hình OBN-SBN (Trang 48)
Hình 5-9: Di chuyển bộ phận “Monitor” xung quanh trọng tâm - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 9: Di chuyển bộ phận “Monitor” xung quanh trọng tâm (Trang 49)
Hình 5-10: Một vài tấm ảnh “Chair” để thí nghiệm - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 10: Một vài tấm ảnh “Chair” để thí nghiệm (Trang 52)
Hình 5-11: Một số minh họa ảnh hai đối tượng không trùng lắp - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 11: Một số minh họa ảnh hai đối tượng không trùng lắp (Trang 53)
Hình 5-13: Vị dụ minh họa thông tin xác định vị trí (P1,P2:r1) tại nút B1 - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 13: Vị dụ minh họa thông tin xác định vị trí (P1,P2:r1) tại nút B1 (Trang 56)
Hình 5-14: Kiến trúc hệ thống OBN-HSBN - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 14: Kiến trúc hệ thống OBN-HSBN (Trang 57)
Hình 5-16: Mạng HSBN của đối tượng “Telephone” - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 16: Mạng HSBN của đối tượng “Telephone” (Trang 60)
Hình 5-15: Mạng HSBN của đối tượng “Computer” - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 15: Mạng HSBN của đối tượng “Computer” (Trang 60)
Hình 5-17: Mạng HSBN của đối tượng “Chair” - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 17: Mạng HSBN của đối tượng “Chair” (Trang 61)
Bảng 5-3: Danh sách các tham số dùng trong thí nghiệm OBN-HSBN - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Bảng 5 3: Danh sách các tham số dùng trong thí nghiệm OBN-HSBN (Trang 61)
Hình 5-18: Tỉ lệ niềm tin của đối tượng giữa hệ thống SBN-OBN và OBN-SBN. - Ứng dụng mạng HTM và mạng ngữ nghĩa để nhận diện đối tượng phức trong ảnh
Hình 5 18: Tỉ lệ niềm tin của đối tượng giữa hệ thống SBN-OBN và OBN-SBN (Trang 64)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w