Thực nghiệm 1: So sánh ba giải thuật dùng R*-tree, RP và R*-tree kết hợp

Một phần của tài liệu Khai phá dữ liệu chuỗi thời gian dựa vào rút trích đặc trưng bằng phương pháp điểm giữa và kỹ thuật xén ( 167 trang ) (Trang 106 - 109)

với từ bỏ sớm.

Hình 4.7 trình bày kết quả thực nghiệm từ ba thuật toán dùng R*-tree, RP và R*- tree kết hợp với ý tƣởng từ bỏ sớm đƣợc thực hiện trên tập dữ liệu Stock có kích thƣớc 10000 chuỗi với chiều dài motif khác nhau. Hình 4.7(a) là kết quả thực nghiệm về thời gian thực hiện của ba thuật toán. Hình 4.7(b) trình bày kết quả so sánh về thời gian thực hiện giữa hai phƣơng pháp dùng R*-tree và R*-tree kết hợp với ý tƣởng từ bỏ sớm. Hình 4.7(c) trình bày kết quả so sánh độ hữu hiệu của ba thuật toán.

Chúng ta có thể thấy trong hai Hình 4.7(a) và Hình 4.7(b), thời gian thực hiện của phƣơng pháp dùng R*-tree kết hợp với ý tƣởng từ bỏ sớm tốt hơn so với thời gian thực hiện của hai phƣơng pháp còn lại. Trong Hình 4.7(c), chúng ta có thể thấy độ hữu hiệu của phƣơng pháp dùng R*-tree kết hợp với ý tƣởng từ bỏ sớm và độ hữu hiệu của phƣơng pháp chỉ dùng R*-tree là giống nhau, và độ hữu hiệu của hai phƣơng pháp này tốt hơn so với độ hữu hiệu của phƣơng pháp RP.

89

Hình 4.7 Các kết quả thực nghiệm về thời gian thực hiện và độ hữu hiệu của ba thuật toán trên tập dữ liệu Stock với chiều dài motif khác nhau và kích thước tập dữ liệu được chọn cố

định (10000 chuỗi).

Hình 4.8 Các kết quả thực nghiệm về thời gian thực hiện và độ hữu hiệu của ba thuật toán trên tập dữ liệu Stock với kích thước khác nhau

và chiều dài motif cố định là 512.

Hình 4.8 trình bày kết quả thực nghiệm từ ba thuật toán dùng R*-tree, RP và R*- tree kết hợp với ý tƣởng từ bỏ sớm đƣợc thực hiện trên tập dữ liệu Stock với kích thƣớc khác nhau và chiều dài motif cố định là 512. Hình 4.8(a) là kết quả thực nghiệm về thời gian thực hiện của ba thuật toán. Hình 4.8(b) trình bày kết quả so sánh về thời gian thực hiện giữa hai phƣơng pháp dùng R*-tree và R*-tree kết hợp với ý tƣởng từ bỏ sớm. Hình 4.8(c) trình bày kết quả so sánh về độ hữu hiệu của ba thuật toán. Kết

0 5 10 15 20 128 256 512 1024 Run. Time (s) motif length

R*-tree RP R*-tree + E. aban.

(a) 0 2 4 6 128 256 512 1024 Run. Time (s) Motif length

R*-tree R*-tree + E. aban.

(b) 0 0.05 0.1 0.15 128 256 512 1024 Efficiency Motif length

R*-tree RP R*-tree + E. aban.

(c) 0 100 200 300 10000 15000 20000 25000 30000 Run. Time (s) Number of sequences

R*-tree RP R*-tree + E. aban.

(a) 0 10 20 30 40 10000 15000 20000 25000 30000 Run. Time (s) Number of sequences

R*-tree R*-tree + E. aban.

(b) 0 0.02 0.04 0.06 10000 15000 20000 25000 30000 Efficiency Number of sequences

R*-tree RP R*-tree + E. aban.

90

quả thực nghiệm trong trƣờng hợp này cũng cho thấy thời gian thực hiện của phƣơng pháp dùng R*-tree kết hợp với ý tƣởng từ bỏ sớm tốt hơn so với hai phƣơng pháp còn lại. Độ hữu hiệu của phƣơng pháp dùng R*-tree kết hợp với ý tƣởng từ bỏ sớm và độ hữu hiệu của phƣơng pháp chỉ dùng R*-tree là giống nhau. Độ hữu hiệu của hai phƣơng pháp này tốt hơn độ hữu hiệu của phƣơng pháp RP.

Hình 4.9 Các kết quả thực nghiệm về thời gian thực hiện và độ hữu hiệu của ba thuật toán trên các tập dữ liệu khác nhau với kích thước cố định (10000 chuỗi)

và chiều dài motif cố định là 512.

Hình 4.9 trình bày kết quả thực nghiệm từ ba thuật toán dùng R*-tree, RP và R*- tree kết hợp với ý tƣởng từ bỏ sớm đƣợc thực hiện trên bốn tập dữ liệu khác nhau có kích thƣớc cố định (10000 chuỗi) và chiều dài motif đƣợc chọn cố định là 512. Hình 4.9(a) là kết quả thực nghiệm về thời gian thực hiện của ba thuật toán. Hình 4.9(b) trình bày kết quả so sánh về thời gian thực hiện giữa hai phƣơng pháp dùng R*-tree và R*-tree kết hợp với ý tƣởng từ bỏ sớm. Hình 4.9(c) trình bày kết quả so sánh về độ hữu hiệu của ba thuật toán. Một lần nữa, thời gian thực hiện của phƣơng pháp dùng R*-tree kết hợp với ý tƣởng từ bỏ sớm tốt hơn so với hai phƣơng pháp còn lại. Độ hữu hiệu của phƣơng pháp dùng R*-tree kết hợp với ý tƣởng từ bỏ sớm và độ hữu hiệu của phƣơng pháp chỉ dùng R*-tree là giống nhau. Độ hữu hiệu của hai phƣơng pháp này tốt hơn độ hữu hiệu của phƣơng pháp RP.

0 50 100 150

Stock ECG W.Form Consumer

Run. Time (s)

Datasets

R*-tree RP R*-tree + E. aban. (adsbygoogle = window.adsbygoogle || []).push({});

(a)

0 20 40

Stock ECG W.Form Consumer

Run. Time (s)

Datasets

R*-tree R*-tree + E. aban.

(b) 0 0.1 0.2 0.3 0.4

Stock ECG W.Form Consumer

Efficiency

Datasets

R*-tree RP R*-tree + E. aban.

91

Bảng 4.1 trình bày kết quả thực nghiệm trên tập dữ liệu Stock về độ hữu hiệu với chiều dài motif khác nhau và Bảng 4.2 trình kết quả thực nghiệm trên các tập dữ liệu khác nhau về độ hữu hiệu với chiều dài motif là 512.

Bảng 4.1 Độ hữu hiệu với chiều dài motif khác nhau (tập dữ liệu Stock).

Bảng 4.2 Độ hữu hiệu với các tập dữ liệu khác nhau (chiều dài motif 512).

Kết quả thực nghiệm đƣợc trình bày trong các bảng 4.1 và 4.2 cho thấy mức độ cải thiện của phƣơng pháp 1 so với giải thuật brute-force là khoảng vài nghìn lần.

Một phần của tài liệu Khai phá dữ liệu chuỗi thời gian dựa vào rút trích đặc trưng bằng phương pháp điểm giữa và kỹ thuật xén ( 167 trang ) (Trang 106 - 109)