CHƯƠNG 4 : HIỆN THỰC VÀ THỬ NGHIỆM
4.3 Nhận xét kết quả thực nghiệm
Qua các kết quả thực nghiệm mà chúng tôi thực hiện, chúng tôi nhận thấy rằng giải thuật phát hiện mô típ với chiều dài khác nhau (MC) đã đạt được mục tiêu đề ra là phát hiện được hầu hết các mô típ có trong dữ liệu chuỗi thời gian.
So sánh với giải thuật phát hiện mô típ dựa vào điểm cực trị quan trọng (EP_C) thì hai giải thuật này đều đạt được mục đích là phát hiện được các mô típ mà các thể hiện trong mô típ có thể có chiều dài khác nhau. Tuy nhiên, giải thuật EP_C không phát hiện được các mô típ có chiều dài khác nhau trong dữ liệu, trong khi đó giải thuật MC đạt được điều này. MC có thể phát hiện hầu hết các mô típ từ nhỏ đến lớn trong dữ liệu chuỗi thời gian.
Xét về độ chính xác, giải thuật MC phụ thuộc vào kết quả của giải thuật chiếu ngẫu nhiên nên cho kết quả chưa chính xác đối với những mô típ nhỏ, nhưng đối với những mô típ lớn tìm được thì tương đối chính xác.
Thời gian chạy của giải thuật MC không quá chậm hơn thời gian chạy của giải thuật EP_C đối với các tập dữ liệu nhỏ. Đối với các tập dữ liệu lớn hoặc các tập dữ liệu có biến đổi giống nhau (ví dụ dữ liệu điện tâm đồ) thì giải thuật MC cho kết quả chậm hơn giải thuật EP_C rất nhiều. Khi chạy giải thuật MC trên các tập dữ liệu lớn, ma trận đụng độ sinh ra từ giải thuật chiếu ngẫu nhiên sẽ rất lớn, điều đó góp phần làm tăng thời gian của giải thuật MC. Đối với những dữ liệu có biến đổi giống nhau xuyên suốt chuỗi thời gian thì giải thuật MC sẽ phải phát hiện mô típ có chiều dài rất lớn theo phương pháp nối mô típ, kết quả là làm tăng thời gian thực thi.
Ngoài sự phụ thuộc vào dữ liệu, cũng giống như những giải thuật khác, tốc độ thực thi và độ chính xác của việc phát hiện mô típ của giải thuật MC phụ thuộc vào việc chọn các thông số đầu vào hợp lý. Giá trị w_PAA và w càng lớn thì thời gian chạy càng nhanh, nhưng khả năng phát hiện mô típ và độ chính xác càng giảm và ngược lại.