Phân đoạn ảnh là quá trình hòa nhập các điểm ảnh có các đặc tính tƣơng tự vào cùng một nhóm. Ảnh phân đoạn do đó là hợp của các nhóm phân biệt, tại đó các điểm ảnh của các vùng đồng nhất đƣợc kết hợp đến cùng nhóm.
Sau khi tiền xử lý, sử dụng thuật toán K-means là một trong những phƣơng pháp học máy không giám sát đơn giản mà giải quyết về vấn đề phân đoạn nổi tiếng [9]. K-means là thuật toán K-mean là thuật toán rất quan trọng và đƣợc sử dụng phổ biến trong kỹ thuật phân cụm với khả năng cài đặt dễ dàng và độ phức tạp tuyến tính. Tƣ tƣởng chính của thuật toán K-mean là tìm cách phân nhóm các đối tƣợng đã cho vào K cụm (K là số các cụm đƣợc xác định trƣớc, K nguyên dƣơng) sao cho tổng bình phƣơng khoảng cách giữa các đối tƣợng đến tâm nhóm là nhỏ nhất.
Bài toán phân cụm dữ liệu bằng thuật toán K-means được trình bày như sau:
Cho tập các điểm D={x1, x2,....,xn},
Trong đó xi=(xi1,xi2,...,xir) là một vector có r chiều trong không gian Rr, và r là một thuộc tính của tập dữ liệu D.
Giải thuật K-mean phân cụm dữ liệu dựa trên khoảng cách Euclid nhỏ nhất giữa đối tƣợng đến phần tử trung tâm của các nhóm
Khoảng cách Euclid:
Ta giả sử nhƣ sau:
xi= (xi1,xi2,...,xir) là đối tƣợng thứ i cần phân loại (i=1..n). cj= (cj1,cj2,...,cjr) là phần tử trung tâm nhóm j (j=1..r)
Trong đó:
ij là khoảng cách Euclid từ ai đến cj xis là thuộc tính thứ s của đối tƣợng xi
xjs là thuộc tính thứ s của phần tử trung tâm cj.
Phần tử trung tâm của nhóm đƣợc xác định bằng giá trị trung bình của các phần tử trong nhóm.
Phần tử trung tâm:
Chọn ngẫu nhiên k phần tử trung tâm (k nhóm), sau mỗi lần gom nhóm các đối trƣợng, phần tử trung tâm đƣợc tính toán lại.
Clusteri{x1,x2,...,xt} – nhóm thứ i
i=1...k, k số nhóm cần phân cụm; j=1...r, r số thuộc tính. t: số phần tử hiện của của nhóm thứ i;
xsj: thuộc tnhs thứ j của phần tử s, s=1..t; cij: tọa độ thứ j của phần tử trung tâm nhóm i;
Giải thuật K-means:
1. Chọn ngẫu nhiên K tâm (center) của K cụm (cluster).
2. Tính toán khoảng cách từ tâm tới tất cả các đối tƣợng (thƣờng dùng khoảng cách Euclid).
3. Nhóm đối tƣợng vào các nhóm gần nhất dựa trên khoảng cách.
5. Lặp lại bƣớc 2, 3, 4 cho tới khi hội tụ.
Trong nghiên cứu này, chúng tôi chọn số cụm K=5; đối tƣợng phân cụm chính là giá trị điểm ảnh (pixels); nhƣ vậy việc phân đoạn ảnh dựa trên phân cụm màu của các điểm ảnh.