1. Trang chủ
  2. » Giáo Dục - Đào Tạo

THUẬT TOÁN CHAMELEON DỰA TRÊN CẢI THIỆN BIỂU ĐỒ LÂN CẬN TỰ NHIÊN TẠO CÁC CỤM CON

30 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 30
Dung lượng 3,02 MB

Nội dung

THUẬT TOÁN CHAMELEON DỰA TRÊN CẢI THIỆN BIỂU ĐỒ LÂN CẬN TỰ NHIÊN TẠO CÁC CỤM CON. PowerPoint Presentation THUẬT TOÁN CHAMELEON DỰA TRÊN CẢI THIỆN BIỂU ĐỒ LÂN CẬN TỰ NHIÊN TẠO CÁC CỤM CON Giới thiệu Giới thiệu Thuật toán chameleon nguyên bản Thuật toán đề xuất Đánh giá hiệu suất K.

THUẬT TOÁN CHAMELEON DỰA TRÊN CẢI THIỆN BIỂU ĐỒ LÂN CẬN TỰ NHIÊN TẠO CÁC CỤM CON Giới thiệu Giới thiệu Thuật toán chameleon nguyên Thuật toán đề xuất Đánh giá hiệu suất Kết luận Giới thiệu Phân cụm liệu (Clustering): Công cụ quan trọng công nghệ khai thác liệu phương pháp phân tích liệu phổ biến Phân chia trường hợp tương tự vào cụm theo đặc điểm liệu đối tượng, mức độ tương tự cá thể cụm khác thấp Phân thành lớp: phân cụm dựa phân vùng, phân cụm dựa mật độ, phân cụm dựa lưới, phân cụm dựa mơ hình, phân cụm phân cấp Giới thiệu Nhược điểm phân cụm truyền thống: Nhiều thuật tốn khơng tạo kết phân cụm người Một số gán nhãn xác cho cụm, nhiều thuật toán khác chấp nhận gán mờ cho nhiều cụm khác Nhược điểm phương pháp phân cụm dựa nguyên mẫu gán điểm liệu cho centroid gần nhất, phương pháp phát cụm hình cầu Giới thiệu Phân cụm phân cấp (Hierarchical clustering):  Là thuật toán phân cụm phổ biến  Biểu diển phổ biến:  BIRCH: Lặp lại cân giảm phân cụm cách sử dung cấu trúc phân cấp  CURE: Phân cụm dựa vào đại diện, sử dụng trung điểm dựa vào trọng tâm điểm toàn phần cực trị  ROCK: Phân cụm mạnh mẽ dựa vào liên kết, cân nhắc giống cặp liệu đối tượng Vấn đề phân cấp gặp phải cần lựa chọn đại lượng c cẩn thận trước thực hợp phân tách cụm hai cụm hợp thành cụm cụm phân tách thành hai cụm mới, trình xử lý hoạt động cụm q trình xử lý trước khơng thể bị thu hồi Giới thiệu Thuật toán Chameleon: Là thuật toán phân cụm dựa đồ thị, cố gắng khắc phục hạn chế phương pháp phân cụm truyền thống Hoạt động cách kết nối điểm liệu gần có tính đến thuộc tính cụm bên hợp chúng với Khơng giống thuật tốn khác, Chameleon tạo kết giống người Giới thiệu Gồm bước: Thứ nhất, cấu trúc đồ thị k-lân cận gần cách lập mơ hình ban đầu tập liệu Thứ hai, Tắc kè hoa sử dụng thuật toán hMetis, phân vùng k đồ thị lân cận gần để tìm cụm ban đầu Cuối cùng, liên kết tương đối gần gũi sử dụng làm tiêu chuẩn để tìm cụm nhiều lần hợp cụm Giới thiệu Vấn đề cịn tồn tại: Thuật tốn chameleon cần phải xây dựng đồ thị k-lân cận, lựa chọn giá trị k can thiệp thủ cơng, giá trị khác có ảnh hưởng lớn tới kết phân cụm Nó khó xây dựng mơi trường cho việc sử dụng thuật tốn hMetis, chia vùng không liên quan tới dẫn tới phân vùng không hợp lý Thuật toán Chameleon nguyên  Hoạt động biểu đồ biểu diễn liệu  Thuật toán Chameleon gồm bước: Bước 1: Xây dựng đồ thị kNN cho tập điểm liệu (nếu đồ thị có, bỏ qua bước này) Bước 2: Phân rã đồ thị tạo thành phân vùng nhỏ có kích thước gần thuật tốn hMetis, giảm thiểu số lượng cạnh bị cắt (với cạnh bị cắt cạnh có trọng số nhỏ, với đảo ngược khoảng cách điểm) Sau phân vùng, nhiều cụm nhỏ có kết nối cao hình thành Bước 3: Hợp nhật bước cuối quan trọng nhất, khơng chọn lựa tốt trực tiếp dẫn đến kết phân cụm Thuật toán xem xét tới độ tương đồng cặp cụm (bao gồm tính liên kết tương đối tính gần gũi tương đối) Thuật toán Chameleon nguyên Xây dựng đồ thị GINN Xây dựng đồ thị GINN Bước 3: Đánh giá số thành phần liên thông c đồ thị có lớn số cụm m Nếu c

Ngày đăng: 08/11/2022, 14:07

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w