Cấu trỳc lưới phõn cụm

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số vấn đề về phân cụm dữ liệu luận văn ths công nghệ thông tin 1 01 10 (Trang 73 - 74)

3.5.1. Thuật toỏn STING

STING (a STatistical INformation Grid approach, Wang, Yang and Muntz, 1997) là kỹ thuật phõn cụm đa phõn giải dựa trờn lưới, trong đú

vựng khụng gian dữ liệu được phõn ró thành số hữu hạn ụ hỡnh chữ nhật, điều này cú nghĩa là cỏc ụ lưới được hỡnh thành từ cỏc ụ lưới con để thực hiện phõn cụm. Cú nhiều mức của cỏc ụ chữ nhật tương ứng với cỏc mức khỏc nhau của phõn giải trong cấu trỳc lưới, cỏc ụ này hỡnh thành cấu trỳc phõn cấp. Mỗi ụ ở mức cao được phõn hoạch thành một số cỏc ụ ở mức thấp hơn tiếp theo trong cấu trỳc phõn cấp. Cỏc điểm dữ liệu được nạp từ CSDL, giỏ trị của cỏc tham số thống kờ ở cỏc ụ mức thấp hơn. Cỏc giỏ trị của cỏc tham số thống kờ là: số trung bỡnh-mean, số tối đa-max, số tối thiểu-min, số đếm - count, độ lệch chuẩn - s,…

Cỏc đối tượng dữ liệu lần lượt được chốn vào lưới và cỏc tham số thống kờ ở trờn được tớnh trực tiếp thụng qua cỏc đối tượng dữ liệu này. Cỏc truy vấn khụng gian được thực hiện bằng cỏch xột cỏc ụ thớch hợp tại mỗi mức của

phõn cấp. Một truy vấn khụng gian được xỏc định như là một thụng tin khụi phục lại của dữ liệu khụng gian và cỏc quan hệ của chỳng. STING cú khả năng mở rộng cao nhưng do được sử dụng phương phỏp đa phõn giải nờn nú phụ thuộc chặt chẽ vào trọng tõm của mức thấp nhất. Đa phõn giải là khả năng phõn ró tập dữ liệu thành cỏc mức chi tiết khỏc nhau. Khi hũa nhập cỏc ụ của cấu trỳc lưới để hỡnh thành cỏc cụm, nú khụng xột quan hệ khụng gian giữa cỏc nỳt của mức con khụng được hũa nhập phự hợp (do chỳng chỉ tương tỏc với cỏc cha của nú). Tất cả ranh giới của cỏc cụm cú biờn ngang và dọc, theo biờn của cỏc ụ và khụng cú đường biờn chộo được phỏt hiện ra.

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số vấn đề về phân cụm dữ liệu luận văn ths công nghệ thông tin 1 01 10 (Trang 73 - 74)

Tải bản đầy đủ (PDF)

(118 trang)