CHƢƠNG 3: THUẬT TỐN BẢN ĐỒ TỰ TỔ CHỨC
3.8. Các phƣơng pháp trực quan hĩa “bản đồ tự tổ chức”
Thuật tốn SOM với những ƣu điểm của nĩ, đã trở thành cơng cụ cĩ ích trong việc học khơng giám sát. Đĩ là, tạo ra hàm phân bố xác suất cho tập dữ liệu ban đầu, dễ giải thích và quan trọng nhất là trực quan hố tốt [9]. Tùy theo vấn đề cần giải quyết, các chuyên gia cĩ thể chọn các phƣơng pháp khác nhau để phân tích dữ liệu đầu ra. Thế nhƣng với phƣơng pháp SOM cĩ thể làm nhiều cơng việc cùng một lúc và cho kết quả tƣơng đƣơng với việc kết hợp nhiều phƣơng pháp khác với nhau [13]. Nhƣ đã trình bày, SOM rất hiệu quả trong các tiến trình huấn luyện và
rút gọn kích thƣớc dữ liệu. Nếu tích hợp SOM với các phƣơng pháp khác cĩ thể sinh luật.
Trực quan hố: rất cĩ ý nghĩa trong việc học khơng giám sát, là yếu tố quan
trọng trong báo cáo kết quả hoặc “tạo” tri thức. Các minh hoạ trực quan dùng để hiểu thấu đáo tập dữ liệu và tĩm tắt cấu trúc tập dữ liệu. Cĩ thể khẳng định điểm mạnh của SOM là phƣơng pháp trực quan hố . Các kỹ thuật trực quan hố dùng SOM gồm:
- Trực quan hố ma trận: gồm trực quan hố các thành phần (component
planes) của vectơ và sự tƣơng quan giữa chúng; trực quan hố ma trận hợp nhất khoảng cách U (unified distance matrix – U Matrix) để biểu diễn cấu trúc cụm của dữ liệu, ánh xạ Sammon [11] thể hiện hình ảnh của ma trận trong khơng gian đầu vào, các màu hoặc nhãn giống nhau thể hiện các vectơ ở gần nhau. Các biểu đồ dữ liệu và phƣơng pháp chiếu tập dữ liệu cho mục đích trực quan.
- Trực quan hố đối tượng: thực chất là áp dụng SOM để chọn lọc đặc tính
nổi trội của các thành phần dữ liệu, bằng cách đánh màu tự động cho mỗi đơn vị của ma trận hoặc ấn định màu bằng tay. Mỗi điểm của đối tƣợng đƣợc đánh dấu bằng màu phù hợp với màu BMU của điểm đĩ. Những nơron cĩ màu hoặc nhãn giống nhau sẽ ở vị trí gần nhau trên bản đồ.