SOM gồm có một lớp nơron tự tổ chức, mảng hai chiều hoặc đa chiều. Nơron có nhiều kết nối đầu vào do bởi có một số thuộc tính đƣợc sử dụng trong phân loại. Thủ tục huấn luyện gồm có: tìm ra nơron với trọng số gần nhất từ vector dữ liệu đầu vào và khai báo nơron nhƣ là nơron chiến thắng. Khi trọng số của tất cả các nơron ở lân cận nơron chiến thắng đƣợc điều chỉnh bởi số lƣợng tỉ lệ với khoảng cách. Phạm vi đƣợc công nhận bị giảm nhƣ là số lần lặp đƣợc tăng lên. Quá trình huấn luyện đƣợc hoàn thành nếu một số quy định lặp đạt đƣợc.
Khoảng cách Euclide đƣợc sử dụng SOM xác định nơron chiến thắng. Mỗi đầu vào đƣợc gán cho một trọng số bởi một nơron tƣơng ứng với vector trọng số và kết quả đƣợc tổng hợp. Điều này đại diện cho đầu vào thực của nơron đặc biệt. K đại diện cho nơron thứ k và n thuộc tính đƣợc sử dụng đại diện cho đầu vào cuối cùng.
(2.12)
Kết quả của vector vô hƣớng sẽ cho dự báo của một vector khác. Nếu vector đơn vị đƣợc mặc định trong xi và wi ta thu đƣợc cosin của 1 góc giữa vector x,w. Vector vô hƣớng, đầu ra lớn nhất đƣợc lựa chọn là chiến thắng.
Khi sử dụng khoảng cách Euclide trong thuật toán SOM, phạm vi của các biến riêng biệt đóng vai trò quyết định trong việc xác định bản đồ tƣơng tự cuối cùng. Nếu phạm vi các giá trị của một biến là lớn hơn nhiều so với các biến khác,
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn
khi đó các biến có thể chiếm ƣu thế trong tổ chức của SOM. Do đó thành phần dữ liệu thƣờng đƣợc chuẩn hóa trƣớc khi thực hiện để mỗi biến có sự thống nhất.