Tính hiệu quả của giải thuật

Một phần của tài liệu Nhận dạng motif trên dữ liệu chuỗi thời gian không cần xác định thông số chiều dài (Trang 102 - 105)

Cán bộ chấm nhận xét 2: TS Phạm Văn Chung

5. Uỷ viên: PGS TS Dương Tuấn Anh

4.3 Tính hiệu quả của giải thuật

4.3.1 Tính hiệu quả của nguyên lý MDL đối với giải thuật

phát hiện motif không cần xác định thông số chiều dài

Hình 4.35 chỉ ra rằng các motif được phát hiện từ chuỗi thời gian. Cả hai chuỗi thời gian có một mẫu có đặc điểm giống nhau (đường in đậm). Tuy nhiên, chiều dài và

sự xuất hiện của các đỉnh thì khác nhau.

Chương 4: Hiện thực và thử nghiệm GVHD: PSG. TS. Dương Tuấn Anh

Nguyễn Văn Nhất_10070490 Trang 87

Ở đây ta có thể thấy rằng, các motif trong Hình 4.35(b) khơng phải là những

mẫu xuất hiện thường xuyên nhất. Bởi vì, số lần xuất hiện của mẫu mà có đỉnh thấp

được chỉ bằng mũi tên thì lớn hơn số lần xuất hiện của motif này. Tuy nhiên, dựa

trên ngun lý MDL, motif này có thể mơ tả chuỗi thời gian được cho với chiều dài mô tả ngắn nhất. Đó là nhờ nguyên lý MDL không chỉ quan tâm đến số lần xuất

hiện của mẫu mà còn quan tâm đến chiều dài mô tả của dữ liệu chuỗi thời gian được cho. Vì vậy, có thể nói rằng ngun lý MDL rất hữu dụng cho việc phát hiện motif trên dữ liệu chuỗi thời gian.

4.3.2 Tính hiệu quả của giải thuật mở rộng EMD

Hình 4.36(a) chỉ ra một ví dụ của motif được phát hiện bằng giải thuật mở rộng

EMD. Trong Hình 4.36(b), cũng chỉ ra rằng chiều dài của các chuỗi con khác nhau.

Hình 4.36 Motif được phát hiện từ chuỗi thời gian. (a) Motif được phát hiện bằng giải thuật mở rộng EMD. (b) Hình ảnh phóng lớn của ba chuỗi con của motif. (c) Motif được rút trích bằng giải thuật MD [5]

Chương 4: Hiện thực và thử nghiệm GVHD: PSG. TS. Dương Tuấn Anh

Nguyễn Văn Nhất_10070490 Trang 88

Để so sánh giải thuật mở rộng EMD với giải thuật MD, xét một motif được

phát hiện bởi giải thuật MD như trong Hình 4.36(c). Hai chuỗi con của motif cũng chứa một thung lũng (valley). Tuy nhiên, thung lũng thứ ba được chỉ bằng mũi tên thì khơng được phát hiện như là một motif. Hiện tượng này xuất hiện là do giải

thuật MD chỉ có thể dị tìm được các mẫu có chiều dài giống nhau. Mặc khác, giải thuật mở rộng EMD xem chuỗi con có thung lũng thứ ba như là motif bởi vì nó có thể dị tìm được các mẫu có chiều dài khác nhau. Vì vậy, giải thuật EMD hiệu quả hơn so với giải thuật MD. Do đó, giải thuật mở rộng EMD rất hữu dụng trong việc rút trích motif từ dữ liệu chuỗi thời gian.

4.3.2 Tính hiệu quả của phép vị tự đối với giải thuật

EMD|HT

Việc áp dụng phép vị tự trong giải thuật mở rộng đã làm tăng hiệu suất thời gian

thực thi của giải thuật vì những lý do sau đây. Khi giải thuật mở rộng EMD áp dụng phép vị tự trên các chuỗi con để làm cho hai chuỗi con có chiều dài khác nhau trở thành hai chuỗi con có chiều dài bằng nhau. Khi đó, hàm tính khoảng cách Euclid sẽ được sử dụng để tính tốn khoảng cách giữa chúng thay vì dùng hàm tính khoảng cách xoắn thời gian động. Vì độ phức tạp của hàm tính tốn khoảng cách Euclid đơn giản hơn rất nhiều so với hàm tính khoảng cách bằng phương pháp xoắn thời

gian động nên giải thuật EMD|HT đã tăng hiệu suất về mặt thời gian thực thi rất đáng kể mà chất lượng của motif tìm được cũng được cải thiện so với giải thuật

EMD|DTW. Điều này dễ dàng thấy được qua phần thực nghiệm trên các tập dữ liệu thời gian khác nhau, được trình bày trong phần 4.1.

Chương 5: Kết luận GVHD: PSG. TS. Dương Tuấn Anh

Nguyễn Văn Nhất_10070490 Trang 89

CHƯƠNG 5 KẾT LUẬN

Chương này sẽ trình bày những kết quả đạt được của luận văn và hướng phát triển của đề tài trong tương lai.

Một phần của tài liệu Nhận dạng motif trên dữ liệu chuỗi thời gian không cần xác định thông số chiều dài (Trang 102 - 105)