Màn hình thiết lập thông số cho các thuật toán

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Một số thuật toán phân cụm trong khai phá dữ liệu Luận văn ThS. Công nghệ thông tin 1.01.10 (Trang 115 - 116)

5.3. Kết quả thử nghiệm

Phần này đưa ra kết quả của một số lần thực hiện thuật toán với các tham số: số

Chúng ta không có điều kiện để phân tích thống kê đầy đủ các kết quả. Các kết quả này chỉ mang tính chất minh hoạ cho hiệu quả của từng thuật toán. Từ đó giúp ta sánh được các thuật toán đang xét.

Quá trình thử nghiệm được thực hiện trên máy Intel Pentium 4, 1600Mhz, 512 kB L2 - cache và 512MB bộ nhớ RAM, hệ điều hành Windows XP.

Trước hết, ta thấy tốc độ thực hiện thuật toán phụ thuộc vào số vector cần phân cụm. Bảng 5.1 chỉ ra kết quả từ 6 lần thực hiện phân cụm (số cụm được giữ không đổi là 20).

Thuật toán GAS không thực hiện được với 3 tập dữ liệu lớn bởi vì trên thực tế, thời gian thực hiện của thuật toán là O(N3). Hiệu suất của các thuật toán khác có vẻ tỷ lệ với N2

. Trong mỗi lần phần cụm, GDS thực hiện là khá lâu so với MBSAS hoặc TTSAS. Chú ý rằng thời gian thực hiện dưới 100ms là không thể chính xác được.

Bảng 5-1: Thời gian thực hiện của các thuật toán với dữ liệu khác nhau

Số vector Thuật toán N=1000 N=2000 N=4000 N=8000 N=16000 N=32000 MBSAS 10ms 10ms 20ms 70ms 310ms 960ms TTSAS 0 0 20ms 60ms 320ms 900ms GDS 80ms 360ms 1.5s 7.1s 37.4s 231.6s GAS 12.4s 185.1s 0.4h - - - 5.3.1. Ảnh hƣởng của các tham số

Ảnh hưởng của các tham số cũng được khảo sát với các tập dữ liệu ngẫu nhiên. Hình 5.4 chỉ ra kết quả khi chọn sai tham số cho thuật toán TTSAS.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Một số thuật toán phân cụm trong khai phá dữ liệu Luận văn ThS. Công nghệ thông tin 1.01.10 (Trang 115 - 116)

Tải bản đầy đủ (PDF)

(131 trang)