Thuật tốn SOM

Một phần của tài liệu Ứng dụng bản đồ tự tổ chức self organizing map (SOM) nhằm phát hiện tấn công web server qua hành vi luận văn thạc sĩ (Trang 27 - 29)

CHƢƠNG 3: THUẬT TỐN BẢN ĐỒ TỰ TỔ CHỨC

3.3.Thuật tốn SOM

Xét một tập dữ liệu là các vectơ trong khơng gian n chiều:

(3.1)

Thơng thƣờng SOM gồm M nơron nằm trong một bản đồ (thƣờng cĩ kích thƣớc 2 chiều). Một nơron thứ i là một vectơ mẫu cĩ kích thƣớc p:

Các nơron trong bản đồ cĩ liên kết đến các nơron lân cận bằng một quan hệ láng giềng. Các láng giềng liền kề là các nơron lân cận tuỳ theo bán kính lân cận của nơron thứ i.

Ni (d) = { j,di,j < d } với d là bán kính lân cận

Các nơron lân cận tùy thuộc vào bán kính, đƣợc sắp xếp trong lƣới theo hình chữ nhật hoặc hình lục giác. Số các lân cận xác định trọng tâm của ma trận kết quả, cĩ ảnh hƣởng đến độ chính xác và khả năng sinh ma trận của SOM.

Hình 3.4: Những vùng lân cận của nơron chiến thắng

Trong thuật tốn SOM, các quan hệ hình học và số các nơron là cố định ngay từ đầu. Số lƣợng nơron thƣờng đƣợc chọn đủ lớn nếu cĩ thể, bằng cách điều khiển kích thƣớc lân cận cho phù hợp. Nếu kích thƣớc lân cận đƣợc lựa chọn là phù hợp thì ma trận khơng bị mất mát thơng tin nhiều ngay cả khi số các nơron vƣợt quá số các vectơ đầu vào.

Trƣớc khi huấn luyện các giá trị ban đầu đƣợc đƣa ra là các vectơ trọng số. SOM là khơng phụ thuộc nhiều đối với dữ liệu ban đầu (dữ liệu cĩ thể bị thiếu), nhƣng thuật tốn SOM vẫn hội tụ. Dùng một trong ba thủ tục khởi tạo điển hình sau:

 Khởi tạo ngẫu nhiên, vectơ trọng số ban đầu đƣợc gán giá trị ngẫu nhiên đủ nhỏ.

 Khởi tạo ví dụ, vectơ trọng số ban đầu đƣợc gắn với các ví dụ ngẫu nhiên rút ra từ tập dữ liệu.

 Khởi tạo tuyến tính, vectơ trọng số ban đầu đƣợc gắn trong một khơng gian con tuyến tính bởi hai vectơ của tập dữ liệu ban đầu.

Một phần của tài liệu Ứng dụng bản đồ tự tổ chức self organizing map (SOM) nhằm phát hiện tấn công web server qua hành vi luận văn thạc sĩ (Trang 27 - 29)