Những vấn đề đặt ra trong quá trình phân cụm dữ liệu đòi hỏi phải có những phƣơng pháp giải quyết đƣa giải thuật về mức thi hành đƣợc và tạo ra một hiệu quả thực sự cho quá trình phân cụm dữ liệu.
39
Qua quá trình nghiên cứu các phƣơng pháp phân chia nhóm trên các mạng SOM đã đƣợc huấn luyện có thể chỉ ra một số đặc điểm của mạng SOM sau khi huấn luyện nhƣ sau:
Các neural trong lớp Kohonen biến đổi liên tục và ranh giới giữa các cụm biến thiên liên tục. Vì vậy mà giữa các nhóm hình thành những ranh giới không rõ ràng rất khó khăn cho quá trình phân nhóm các neural.
Việc xác định đâu là một nhóm mới và ranh giới giữa 2 nhóm không có một chuẩn nào cả dẫn đến tình trạng hỗn tạp giữa các nhóm.
Không thể xác định đâu là trung tâm một nhóm hay đặc trƣng riêng có của nhóm đấy khi chƣa phân cụm.
Vì những nguyên nhân trên mà một giải pháp phân cụm các nhóm là điều vô cùng khó khăn mà nguyên nhân trực tiếp là ranh giới giữa các nhóm là rất mờ nhạt. Vì vậy đòi hỏi một giải pháp mới.
Sau khi nghiên cứu tiến hành cài đặt huấn luyện mạng SOM có thể thấy trong quá trình huấn luyện mạng về bản chất chính là quá trình hình thành nên các nhóm. Chính vì vậy một phƣơng pháp phân chia nhóm ngay từ trong quá trình huấn luyện là một giải pháp hợp lý.
Phương pháp
Mạng đƣợc hình thành và huấn luyện từ những Neural chiến thắng và các nhóm sẽ đƣợc phân chia trong quá trình này. Nhƣ vậy các nhóm sẽ đƣợc hình thành và mang đặc điểm của các neural chiến thắng.
Dựa vào tính chất này ta có thể phân chia các nhóm theo một giải thuật đƣợc đề ra theo 3 nguyên tắc cơ bản đối với những neural bị tác động bởi neural chiến thắng tại một bƣớc trong quá trình huấn luyện nhƣ sau:
1.Với các neural bị tắc động khi chúng chƣa thuộc một nhóm nào sẽ hình thành một nhóm mới mang đặc tính của neural chiến thắng.
2.Với những neural bị tắc động đã thuộc một nhóm nhất định khi nhóm đó không đồng nhất với neural chiến thắng sẽ xảy ra quá trình tranh chấp neural giữa các nhóm.
40
3.Với những độ phân ly quá lớn giữa neural chiến thắng và nhóm cũ vƣợt qua một ngƣỡng nào đó sẽ xảy ra quá trình sinh một nhóm mới.
Nhƣ vậy phƣơng pháp đề ra thực chất chính là quá trình hình thành nhóm, phân li nhóm và tranh chấp neural giữa các nhóm. Với một phát biểu tổng quát hơn ta có thể hình dung quá trình này một cách dễ hiểu hơn nhƣ sau:
Nguyên tắc hình thành và củng cố nhóm
Khi một neural chiến thắng đƣợc xác định nếu nó không thuộc một nhóm nào sẽ hình thành một nhóm mới và thực hiên quá trình tranh chấp neural cho nhóm đó. Nếu nó thuộc một nhóm đã tồn tại sẽ có sự phân ly hoặc củng cố nhóm.
Nguyên tắc phân li nhóm
Khi một neural chiến thắng xác định thỏa điều kiện phân li (khoảng cách của neural chiến thắng với đặc trƣng nhóm là quá lớn vƣợt quá ngƣỡng phân ly) sẽ hình thành một nhóm mới mang đặc tính neural này và tranh chấp neural với nhóm cũ.
Nguyên tắc củng cố nhóm
Khi một neural chiến thắng không thỏa điều kiện phân ly sẽ củng cố đặc trƣng nhóm theo neural đó. Đồng thời tranh chấp neural với các nhóm gần đó theo nguyên tắc tranh chấp.
Nguyên tắc tranh chấp Neural giữa các nhóm
Khi một neural nằm trong vùng giao giữa các nhóm và xảy ra quá trình tranh chấp neural giữa các nhóm. Khi đó sẽ tính khoảng cách từ neural đó tới các nhóm theo đặc trƣng nhóm. Khoảng cách nào ngắn nhất neural sẽ thuộc về nhóm đó.