Mô hình được đề xuất là một mô hình ba lớp:
-Lớp các thuật ngữ truy vấn (các nút mạng đầu vào) – Q layer -Lớp các tài liệu (các nút mạng đầu ra) – D layer
-Lớp các chỉ mục (các nút ẩn) – T layer Trong hình 12, chúng ta có các ký hiệu sau: -ti - chỉ mục thuật ngữ
-Qi - thuật ngữ truy vấn của người dùng
-pij - trọng số kết nối giữa ngăn của mạng thuật ngữ và một ngăn của mạng tài liệu -qi - trọng số liên kết giữa thuật ngữ của truy vấn và thuật ngữ ti
-wij - giá trị liên kết giữa thuật ngữ ti và tj
-dij - trọng số liên kết giữa tài liệu Di và tài liệu Dj
Hình 12: Mô hình biểu diễn mạng nơ-ron
Lớp thuật ngữ truy vấn biểu diễn các yêu cầu người dùng. Mỗi một nút là một thuật ngữ trong truy vấn. Lớp tài liệu biểu diễn tập các tài liệu. Mỗi nút quy chiếu đến một tài liệu. Các nút trong lớp này có các liên kết hai chiều có trọng số, thể hiện sự tương đồng giữa các tài liệu. Giá trị tương đồng này được tính toán bởi trọng số ngữ nghĩa của các thuật ngữ trong mỗi tài liệu. Lớp các thuật ngữ là lớp động. Mỗi nút biểu diễn một thuật ngữ được đánh chỉ mục. Các liên kết có giá trị giữa các nút là các kết lối giữa các thuật ngữ trong pha truy vấn.
Các liên kết có trọng số giữa các ngăn thuộc lớp thuật ngữ có chỉ dẫn và các ngăn thuộc lớp thuật ngữ pij biểu diễn khả năng hay ý nghĩa của thuật ngữ ti trong tài liệu Dj. Liên kết có trọng số qi định nghĩa độ quan trọng của thuật ngữ ti trong toàn bộ tổ hợp các tài liệu. Các giá trị khởi đầu của các trọng số này có thể được trọng ngẫu nhiên hoặc với bất cứ cách xác định nào. Nếu giá trị ngẫu nhiên được sử dụng, có thể ta sẽ phải đối mặt với các vấn đề sau:
- Thời gian học dài. - Khó đạt được sự hội tụ.
Để tìm ra trọng số wij (liên kết giữa ti và tj), chúng ta giả sử rằng độ liên kết giữa hai thuật ngữ tăng khi đồng xuất hiện trong một tài liệu, và giá trị này chỉ giảm khi có một lần xuất hiện trong một tài liệu.
Liên kết giữa hai tài liệu được biểu diễn bởi công thức sau: