2. Một cách tiếp cận cho CBIR sử dụng thuật toán phân lớp K-Means và đặc trƣng hình
2.3. Trích rút đặc trƣng
Bƣớc đầu tiên là việc trích rút các đặc trƣng biểu diễn bởi các vùng hình vuông trong hình ảnh. Ngƣời ta đã chứng minh kích thƣớc 4x4 là tốt, hài hòa giữa việc bảo tồn các chi tiết và thời gian xử lý. Trong bƣớc tiền xử lý này, 3 kênh màu red, green, blue của 16 điểm ảnh đƣợc tính trung bình và đƣa vào một vector đặc trƣng trong không gian 3
R (quy các giá trị về thuộc [0 .. 1]). Các vector này đƣợc sử dụng trong thuật toán phân lớp dữ liệu K-Means. Việc tính trung bình này bằng việc tính hệ số DC của một phép biến đổi cô sin rời rạc, nó là quan trọng nhất cho việc biểu diễn các Block của dữ liệu ảnh [59]. Việc mất đi những cấu trúc chi tiết không phải là nghiêm trọng đối với các đƣờng bao mờ cùng với việc quy các Blockfeatures vào các cụm
48
dựa vào tập mờ. Điều có lợi là khả năng tránh ảnh hƣởng của nhiễu cao hơn và giảm thời gian tính toán hơn làm việc với các pixel riêng lẻ.
Chúng tôi không sử dụng các đặc trƣng kết cấu dựa trên các hệ số bậc cao của phép biến đổi trực giao (ví dụ nhƣ Wavelet hoặc DCT): Trong khi chúng hoạt động rất tốt trong việc phát hiện biên nhƣng không hiệu quả trong việc phân biệt các kết cấu ở mức đối tƣợng. (Điều này có thể là do diện tích che phủ của Blockfeature tƣơng đối nhỏ, cần có thêm các nghiên cứu về vấn đề này). Ngoài ra cũng không sử dụng các thông tin vị trí thông qua các tọa độ x/y của pixel nhƣ việc tạo ra các vùng liên thông compact: Blockfeatures cách xa điểm trung tâm của nhóm hơn sẽ nhận đƣợc một hình phạt theo tỷ lệ khoảng cách đến trung tâm này.