1.2.4. Các phương pháp phân cụm dựa trên lưới
tham số và MinPts. Để nâng cao hiệu quả của phân cụm, tiếp cận phân cụm dựa trên lƣới sử dụng cấu trúc dữ liệu dạng lƣới. Tiếp cận này phân chia không gian dữ liệu vào một số lƣợng hữu hạn các ô tạo nên dạng hình lƣới. Tiện lợi chính của tiếp cận này là thời gian xử lý nhanh và nó không phụ thuộc vào số lƣợng các đối tƣợng dữ liệu, chỉ phụ thuộc vào số lƣợng các ô ở mỗi chiều trong không gian lƣợng hóa.
Một số thuật toán cơ bản của tiếp cận dựa trên lƣới là thuật toán STING, thuật toán này tìm kiếm theo thống kê các thông tin nằm trong các ô. Thuật toán WaveCluster phân cụm dữ liệu sử dụng phƣơng pháp biến đổi sóng và thuật toán CLIQUE trình bày cách tiếp cận dựa vào mật độ và dựa vào lƣới để phân cụm dữ liệu nằm trong không gian với số chiều lớn.
STING: A STatistical INformation Grid approach
STING là một cấu trúc dữ liệu đa mức dựa trên lƣới, trong không gian dữ liệu đƣợc chia thành các ô hình chữ nhật. Có các ô tƣơng ứng với các mức khác nhau để giải quyết bài toán, cách phân chia ô nhƣ vậy tạo ra một cấu trúc phân cấp: mỗi ô ở mức cao đƣợc phân chia thành một số ô ở mức thấp hơn tiếp theo. Thông tin thống kê liên quan tới thuộc tính của mỗi ô nhƣ mean, maximum, minimum đƣợc tính toán trƣớc và lƣu trữ. Những thông tin thông kê này sẽ trợ giúp cho quá trình truy vấn nhƣ sau: