Việc phân lớp hay trích đoạn ảnh có nhiều lớp màu khác nhau của một ảnh màu, trong trường hợp không đầy đủ thông tin tại một thời
điểm vẫn là vấn đề chính được đặt ra trong phân tích ảnh. Vấn đề
khó khăn nhất là tạo ra mô hình và các tham số cho các thông tin đó, các tham số liên quan thì không được biết nhưng chúng lại rất cần để
tính toán trước khi thực hiện phân lớp ảnh. Hơn nữa các kết quả kết nhóm màu được sử dụng một cách liên tục trong thuật toán tìm lỗi kết cấu màu. Do đó trên thực tế việc quan tâm kết cấu của ảnh màu không chỉ cần thiết để rút trích đặc trưng ảnh được tốt, mà còn tách riêng biệt các màu theo kết cấu để mô tả tốt các lớp. Do các yêu cầu như thế nên giai đoạn kết nhóm cũng rất khó khăn
Nhìn chung các kỹ thuật đã được nghiên cứu trước đây đều hướng đến việc khắc phục các vấn đề trên. Ở đây thông qua phương pháp kết nhóm. Độ chính xác của pixel trong các tham số mô tả dữ
liệu của các nhóm tùy thuộc rất lớn vào số lượng các nhóm tạo ra như trong hình 4.6
(a) (b) (c)
Chủ yếu của nghiên cứu này là phát triển một thuật toán kết nhóm màu, về cơ bản nó bao gồm hai giai đoạn sau
• Giai đoạn khởi tạo nhóm
• Giai đoạn kết hợp màu giống nhau (các màu giống nhau
được phân biệt theo giác quan)
Nhìn chung chúng ta cố gắng tách biệt ảnh màu theo các nhóm nhỏ chính xác trong không gian RGB, và kết hợp chúng theo một vài
đặc tính chung giống nhau về màu sắc. Từ các giá trị kết nhóm ban
đầu và các kỹ thuật kết nhóm dữ liệu, sẽ có số nhóm bằng với giá trị
khởi tạo được tạo ra có màu sắc giống nhau. Sau đó chúng sẽ được kết nhóm từ nhiều nhóm con có màu giống nhau lại với nhau và được
đánh dấu tạo thành một lớp (gán nhãn cho lớp). Kết quả nếu phân bố
dữ liệu có độ nhẵn thấp thì cách biểu diễn lớp sẽ tốt nhất. Đối với kết quả nghiên cứu trước đây, số lượng thực của các nhóm kết nhóm sẽ được xác định, nhưng trong trường hợp này thì không cần thiết
Khi ta thực hiện khởi tạo nhóm trong không gian RGB. Ở trong không gian RGB các thành phần màu chính thu được bằng cách số
hóa ảnh, nên nhiễu sẽ phân bố đều. Kết quả các nhóm được hình thành trong không gian RGB sẽ chính xác hơn và ít bị nhiễu. Chúng ta giả sử rằng số lượng nhóm khởi tạo mà chúng ta chọn thì đủ lớn
để ta mô tả tốt dữ liệu, đồng thời còn mô tả chính xác sự thay đổi về
màu sắc. Mỗi khi các nhóm được hình thành trong không gian RGB, chúng ta kết hợp chúng lại theo một vài đặc tính thì không phù hợp. Vì khoảng cách của các nhóm được kết nhóm trong không gian RGB thì không thể mô tả được đặc tính vật lý để nhận biết sự khác nhau giữa hai màu. Nói chính xác hơn là khoảng cách giữa hai điểm bất kỳ
trong không gian RGB không cho phép ta đo được sự khác nhau về
kết hợp các nhóm màu có cùng màu lại với nhau và các màu khác nhau phải được tách rời ra, cách tốt nhất là phải biến đổi tất cả các dữ liệu của các nhóm trong không gian RGB sang không gian màu
đồng nhất CIE chỉ giữ lại các nhãn của các lớp. Mỗi lần biến đổi chúng ta sẽ kết hợp các nhóm theo giá trị trung bình đo được, và tính toán sự khác biệt về màu sắc của giá trị trung bình cho hai nhóm. Một
điều cần chú ý là sự hình thành nhóm trong không gian RGB và sự
kết hợp chúng theo giá trị trung bình của nhóm đó trong một không gian màu đồng nhất CIE, chúng ta phải đối mặt với ảnh hưởng của nhiễu phi tuyến trên các nhóm