- – SOM
2.5.3. SOM –Vấn đề số lƣợng nhóm
Trong quá trình ứng dụng mạng SOM vào giải quyết các bài toán phân cụm dữ liệu theo giải thuật đƣợc đƣa ra thì số lƣợng nhóm đƣợc hình thành sau quá trình huấn luyện là ngẫu nhiên và không xác định trƣớc. Trên thực tế có một tham số đầu vào ảnh hƣởng tới số lƣợng nhóm đƣợc hình thành sau quá trình huấn luyện đó là kích thƣớc khởi tạo cho mạng SOM, nhƣng tham số này ảnh hƣởng ít tới số lƣợng nhóm đƣợc hình thành. Và theo những khuyến cáo thì với mỗi bài toán riêng biệt thƣờng có một kích thƣớc mạng SOM chuẩn cho bài toán đó.
Tuy nhiên số lƣợng nhóm đƣợc hình thành sau quá trình huấn luyện lại là một vấn đề lớn ảnh hƣởng trực tiếp tới kết quả sau huấn luyện. Đồng thời với những bài toán phân cụm khác nhau cũng có những yêu cầu khác nhau nhiều trƣờng hợp đòi hỏi số lƣợng nhóm phải đƣợc xác định trƣớc khi phân cụm. Nhƣ vậy khi ứng dụng những giải thuật theo chuẩn thì sẽ có số lƣợng nhóm thƣờng là lớn hơn rất nhiều số lƣợng nhóm đƣợc mong đợi.Vì lý do đó mà việc ứng dụng mạng Nơron vào trong thực tế đòi hỏi một phƣơng pháp khống chế số lƣợng nhóm đƣợc hình thành sau quá trình huấn luyện mạng. Đó là những phƣơng pháp làm tăng hoặc giảm hay thậm chí là cố định số lƣợng nhóm sau quá trình huấn luyện. Và với một tập các dữ liệu dùng để phân cụm phải phân chia đƣợc ra thành các nhóm nhƣ mong đợi.
48
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Với số lƣợng nhóm nhiều hơn cần thiết sẽ gây mất tập chung khi phân cụm dữ liệu và vấn đề sát nhập giữa các nhóm tƣơng đồng gần nhau sau quá trình huấn luyện mạng làm một đòi hỏi cần thiết cho ứng dụng mạng nơron.