CHƯƠNG 4 : HIỆN THỰC VÀ THỬ NGHIỆM
4.2 Kết quả thực nghiệm
4.2.1 Dữ liệu điện tâm đồ với kích thước 7900 điểm
Dữ liệu được sử dụng trong phần thực nghiệm này là dữ liệu điện tâm đồ (ECG) có kích thước 7900 điểm. Dạng biểu diễn của dữ liệu được thể hiện như hình 4-3.
Hình 4-3: Biểu diễn của dữ liệu điện tâm đồ có kích thước 7900 điểm.
4.2.1.1 Giải thuật phát hiện mô típ có chiều dài khác nhau
Giải thuật được thực hiện với các thông số đầu vào như sau:
Ký hiệu Giá trị Chú thích
w_PAA 20 Chiều dài khung w_PAA sử dụng thu giảm số chiều PAA.
a 5 Hệ số a thể hiện độ lớn bảng chữ cái dùng trong SAX.
w 20 Chiều dài chuỗi con w trong giải thuật chiếu ngẫu nhiên.
k 4 Số mặt nạ k trong giải thuật chiếu ngẫu nhiên.
c 10 Số cột c của mỗi mặt nạ trong giải thuật chiếu ngẫu nhiên.
d 1.25 Hệ số d là không gian tìm kiếm trong giải thuật nối mô típ. [α1, α2] [0.65,1.35] Hệ số α1, α2 là hai hệ số góc giới hạn phạm vi tìm kiếm
trong giải thuật nối mô típ.
các lớp tương đương.
Sau khi chạy giải thuật với các thông số trên, chúng tôi thu được 200 phân đoạn, các phân đoạn được phân hoạch vào 140 lớp tương đương. Thời gian chạy của giải thuật là 2480ms (2 giây 480 mili giây). Kết quả chương trình như hình 4-4.
Hình 4-4: Kết quả hiển thị của chương trình sau khi chạy giải thuật MC trên dữ liệu ECG 7900 điểm với w_PAA = 20, w = 20.
Chúng ta xem qua một số mô típ do giải thuật phát hiện được. Các mô típ với các thể hiện của chúng được biểu diễn trong các hình 4-5, hình 4-7, hình 4-8 và hình 4-9.
Hình 4-5: Các thể hiện của mô típ dài nhất ứng với lớp tương đương 138 sau khi chạy giải thuật MC trên dữ liệu ECG 7900 điểm với w_PAA = 20, w = 20.
Từ kết quả mô típ này, chúng tôi có mẫu chung của mô típ như sau:
Hình 4-6: Mẫu chung thu được của mô típ ứng với lớp 138sau khi chạy giải thuật MC trên dữ liệu ECG 7900 điểm với w_PAA = 20, w = 20.
Qua quan sát trên chúng tôi nhận thấy giải thuật có khả năng phát hiện mô típ có chiều dài rất lớn trong dữ liệu chuỗi thời gian.
Hình 4-7: Các thể hiện của mô típ ứng với lớp tương đương 102 sau khi chạy giải thuật MC trên dữ liệu ECG 7900 điểm với w_PAA = 20, w = 20.
Hình 4-8: Các thể hiện của mô típ ứng với lớp tương đương 84 sau khi chạy giải thuật MC trên dữ liệu ECG 7900 điểm với w_PAA = 20, w = 20.
Hình 4-9: Các thể hiện của mô típ ứng với lớp tương đương 75 sau khi chạy giải thuật MC trên dữ liệu ECG 7900 điểm với w_PAA = 20, w = 20.
Ngoài thử nghiệm trên đây, chúng tôi cũng thực hiện nhiều thử nghiệm khác với các thông số khác nhau trên tập dữ liệu này. Từ những kết quả thu thu được, chúng tôi nhận thấy rằng khi chiều dài w_PAA và w càng nhỏ thì giải thuật cho ra
những kết quả chính xác hơn. Trong một thử nghiệm khác trên tập dữ liệu này, chúng tôi cho các thông số đầu vào w_PAA = 10, w = 10, c = 5, các thông số khác như trên. Chúng tôi thu được 5280 phân đoạn và 613 lớp tương đương với thời gian chạy của giải thuật là 110996ms (1 phút 50 giây 996 mili giây). Các mô típ phát hiện được tương đối chính xác hơn.
4.2.1.2 Giải thuật phát hiện mô típ dựa vào điểm cực trị quan trọng
Sau khi thử nghiệm giải thuật phát hiện mô típ có chiều dài khác nhau với tập dữ liệu điện tâm đồ 7900 điểm, chúng tôi tiếp tục thử nghiệm giải thuật phát hiện mô típ dựa vào điểm cực trị quan trọng trên tập dữ liệu này. Các thông số đầu vào của giải thuật như sau:
Ký hiệu Giá trị Chú thích
R 1.2 Hệ số nén trong việc tìm điểm cực trị.
l_min 50 Chiều dài cực tiểu của ứng viên motif.
r 0.2 Tổng số các cụm/ tổng số các điểm cực trị.
l_resample 500 Chiều dài của các ứng viên motif sau khi lấy mẫu. Sau khi chạy giải thuật chúng tôi thu được 17 thể hiện của mô típ. Thời gian chạy của giải thuật là 62ms (62 mili giây). Kết quả chương trình như hình 4-10. Hình 4-11 biểu diễn các thể hiện trong mô típ tìm được.
Hình 4-10: Kết quả hiển thị của chương trình sau khi chạy giải thuật EP_C trên dữ liệu ECG 7900 điểm.
Hình 4-11: Biểu diễn mô típ kết quả sau khi chạy giải thuật EP_C trên dữ liệu ECG 7900 điểm.
Chúng tôi thấy giải thuật này chỉ có thể phát hiện mô típ có mẫu như hình 4-9 trong kết quả của giải thuật MC. Giải thuật này không có khả năng phát hiện những mô típ dài hơn.
4.2.1.3 Kết luận kết quả thực nghiệm thu được của hai giải thuật
Dựa vào kết quả thu được từ các thực nghiệm hai giải thuật trên tập dữ liệu điện tâm đồ 7900 điểm, chúng tôi nhận thấy giải thuật phát hiện mô típ có chiều dài khác nhau có ưu điểm hơn so với giải thuật phát hiện mô típ dựa vào điểm cực trị quan trọng như sau:
Phát hiện mô típ có chiều dài khác nhau tốt hơn. Phát hiện được hầu hết các mô típ có trong tập dữ liệu.