Dữ liệu Memory kích thước 6800 điểm

Một phần của tài liệu Phát hiện mô típ với chiều dài khác nhau trên dữ liệu chuỗi thời gian (Trang 54 - 60)

CHƯƠNG 4 : HIỆN THỰC VÀ THỬ NGHIỆM

4.2 Kết quả thực nghiệm

4.2.2 Dữ liệu Memory kích thước 6800 điểm

Dữ liệu được sử dụng trong phần thực nghiệm tiếp theo này là dữ liệu Memory có kích thước 6800 điểm. Dạng biểu diễn của dữ liệu được thể hiện như hình 4-12.

Hình 4-12: Biểu diễn của dữ liệu Memory có kích thước 6800 điểm.

4.2.2.1 Giải thuật phát hiện mô típ có chiều dài khác nhau

Giải thuật được thực hiện với các thông số đầu vào như sau:

Ký hiệu Giá trị Chú thích

w_PAA 20 Chiều dài khung w_PAA sử dụng thu giảm số chiều PAA.

a 5 Hệ số a thể hiện độ lớn bảng chữ cái dùng trong SAX.

w 20 Chiều dài chuỗi con w trong giải thuật chiếu ngẫu nhiên.

k 4 Số mặt nạ k trong giải thuật chiếu ngẫu nhiên.

c 10 Số cột c của mỗi mặt nạ trong giải thuật chiếu ngẫu nhiên.

d 1.25 Hệ số d là không gian tìm kiếm trong giải thuật nối mô típ. [α1, α2] [0.65,1.35] Hệ số α1, α2 là hai hệ số góc giới hạn phạm vi tìm kiếm

trong giải thuật nối mô típ.

θ 0.98 Hệ số trùng lắp θ dùng để phân hoạch các phân đoạn vào các lớp tương đương.

Sau khi chạy giải thuật với các thông số trên chúng tôi thu được 238 phân đoạn, các phân đoạn được phân hoạch vào 222 lớp tương đương. Thời gian chạy của giải thuật là 202ms (202 mili giây). Kết quả chương trình như hình 4-13.

Hình 4-13: Kết quả hiển thị của chương trình sau khi chạy giải thuật MC trên dữ liệu Memory 6800 điểm với w_PAA = 20, w = 20.

Chúng ta xem qua một số mô típ do giải thuật phát hiện được. Các mô típ với các thể hiện của chúng được biểu diễn trong các hình 4-14, hình 4-15, hình 4-16 và hình 4-17.

Hình 4-14: Các thể hiện của mô típ ứng với lớp tương đương 209 sau khi chạy giải thuật MC trên dữ liệu Memory 6800 điểm với w_PAA = 20, w = 20.

Hình 4-15: Các thể hiện của mô típ ứng với lớp tương đương 132 sau khi chạy giải thuật MC trên dữ liệu Memory 6800 điểm với w_PAA = 20, w = 20.

Hình 4-16: Các thể hiện của mô típ ứng với lớp tương đương 23 sau khi chạy giải thuật MC trên dữ liệu Memory 6800 điểm với w_PAA = 20, w = 20.

Hình 4-17: Các thể hiện của mô típ ứng với lớp tương đương 21 sau khi chạy giải thuật MC trên dữ liệu Memory 6800 điểm với w_PAA = 20, w = 20.

Chúng tôi thực hiện tiếp một thử nghiệm khác với thông số w_PAA = 20, w = 10, c = 5, các thông số khác như trên. Giải thuật có thời gian chạy là 483ms (483 mili giây) và thu được 543 phân đoạn và 425 lớp tương đương. Chúng tôi nhận thấy ngoài những mô típ có chiều dài lớn như trong thử nghiệm ứng với w = 20, giải thuật phát hiện thêm những mô típ ngắn hơn.

Qua quan sát các kết quả thực nghiệm, chúng tôi nhận thấy giải thuật có khả năng phát hiện mô típ rất tốt. Các chuỗi con tuy có nhiễu nhưng có hình dạng biến đổi tương đối giống nhau được phát hiện là mô típ.

4.2.2.2 Giải thuật phát hiện mô típ dựa vào điểm cực trị quan trọng

Sau khi thử nghiệm giải thuật phát hiện mô típ có chiều dài khác nhau với tập dữ liệu Memory 6800 điểm, chúng tôi tiếp tục thử nghiệm giải thuật phát hiện mô típ dựa vào điểm cực trị quan trọng trên tập dữ liệu này. Các thông số đầu vào của giải thuật như sau:

Ký hiệu Giá trị Chú thích

l_min 50 Chiều dài cực tiểu của ứng viên motif.

r 0.2 Tổng số các cụm/ tổng số các điểm cực trị.

l_resample 500 Chiều dài của các ứng viên motif sau khi lấy mẫu. Sau khi chạy giải thuật, chúng tôi thu được 11 thể hiện của mô típ. Thời gian chạy của giải thuật là 156ms (156 mili giây). Kết quả chương trình như hình 4-18. Hình 4-19 biểu diễn các thể hiện trong mô típ tìm được.

Hình 4-18: Kết quả hiển thị của chương trình sau khi chạy giải thuật EP_C trên dữ liệu Memory 6800 điểm.

Hình 4-19: Biểu diễn mô típ kết quả sau khi chạy giải thuật EP_C trên dữ liệu Memory 6800 điểm.

Ta thấy giải thuật này chỉ có thể phát hiện mô típ có chiều dài ngắn và mô típ không đa dạng như giải thuật MC.

4.2.2.3 Kết luận kết quả thực nghiệm thu được của hai giải thuật

Dựa vào kết quả thu được từ các thực nghiệm hai giải thuật trên tập dữ liệu Memory 6800 điểm, chúng tôi nhận thấy giải thuật phát hiện mô típ có chiều dài khác nhau có ưu điểm hơn so với giải thuật phát hiện mô típ dựa vào điểm cực trị quan trọng như sau:

 Phát hiện mô típ có chiều dài khác nhau tốt hơn.  Phát hiện được hầu hết các mô típ có trong tập dữ liệu.

 Phát hiện được những mô típ bị ảnh hưởng bởi nhiễu nhưng có mô hình biến đổi giống nhau.

Một phần của tài liệu Phát hiện mô típ với chiều dài khác nhau trên dữ liệu chuỗi thời gian (Trang 54 - 60)

Tải bản đầy đủ (PDF)

(82 trang)