Nhỏ Apriori-

Một phần của tài liệu TÌM HIỂU các THUẬT TOÁN tìm LUẬT kết hợp ỨNG DỤNG TRONG DATA MINING & hệ hỗ TRỢ CHẨN đoán một số BỆNH THÔNG THƯỜNG ở TRẺ EM (Trang 27 - 29)

Ck: cây băm

CSDL giao tác có số yếu tố trong tổ hợp vừa phải;

Thực hiện tốt hơn AIS và SETM; Thuật toán cơ bản cho các thuật toán song song.

Apriori- TID m+1 Lk-1: bảng băm Ck: mảng sắp xếp theo TID Ck :cấu trúc tuần tự ID: bitmap

Rất chậm với số lượng lớn của Ck

Thực hiện tốt hơn Apriori với số lượng C

k nhỏ.Apriori- Apriori- Hybrid m+1 Lk-1: bảng băm Pha thứ nhất: Ck: cây băm Pha thứ hai: Ck: mảng sắp theo TID Ck : cấu trúc tuần tự ID: bitmap

Tốt hơn Apriori. Tuy nhiên, rất tốn để chuyển từ Apriori sang Apriori-TID

OCD 2 không xác định Thích hợp trong CSDL lớn với ngưỡng

support thấp.

Partition 2 Bảng băm Thích hợp cho CSDL lớn với số yếu tố trong tổ hợp lớn.

Đồng bộ dữ liệu phân tán.

Sampling 2 không xác định Được áp dụng cho CSDL rất lớn với

support thấp.

DIC Tuỳ

thuộc vào kích

Cây tiền tố (prefix-tree) CSDL được xem như là các interval của các giao tác;

thước của

interva l

điểm cuối của một interval.

CARMA 2 Bảng băm Có thể dùng được đối với các giao tác tuần tự được đọc từ Network; Trực truyến, người dùng nhận được thông tin phản hồi liên tục và thay đổi support và/hoặc

confidence bất kỳ thời điểm nào trong suốt quá trình xử lý.

CD m+1 bảng băm và cây Data Parallelism

PDM m+1 bảng băm và cây Data Parallelism với việc tách sớm tổ hợp.

DMA m+1 bảng băm và cây Data Parallelism với việc tách tổ hợp.

CCPD m+1 bảng băm và cây Data Parallelism; trên bộ nhớ dùng chung.

DD m+1 bảng băm và cây Task Parallelism; phân chia vòng robin.

IDD m+1 bảng băm và cây Task Parallelism; phân chia theo phần tử đầu tiên

HPA m+1 bảng băm và cây Task Parallelism; phân chia bởi hàm băm

SH m+1 bảng băm và cây Data Parallelism; các tổ hợp được phát sinh độc lập bởi mỗi bộ xử lý.

HD m+1 bảng băm và cây Lai giữa Data và Task Parallelism; kiến trúc lưới song song

Bảng 4 tổng hợp và cung cấp một sự so sánh ngắn gọn các thuật toán đã được trình bày trong khóa luận này. Ngoại trừ thuật toán Apriori sử dụng trong chương trình demo nên được trình bày chi tiết, hầu hết các thuật toán khác đều chỉ nêu tóm tắt kỹ thuật.

Một phần của tài liệu TÌM HIỂU các THUẬT TOÁN tìm LUẬT kết hợp ỨNG DỤNG TRONG DATA MINING & hệ hỗ TRỢ CHẨN đoán một số BỆNH THÔNG THƯỜNG ở TRẺ EM (Trang 27 - 29)

Tải bản đầy đủ (DOC)

(35 trang)
w