Ràng buộc đối với đường xoắn cho khoảng cách DTW- 123docz.net

CHƯƠNG 3 : CÁC CÔNG TRÌNH CÓ LIÊN QUAN

3.1. Ràng buộc đối với đường xoắn cho khoảng cách DTW

Việc tính DTW có chi phí lớn vì phải tìm đường xoắn đạt giá trị nhỏ nhất trong ma trận bằng quy hoạch động. Độ phức tạp của giải thuật là O(n2). Tuy nhiên, đường xoắn tối ưu thường gần đường chéo của ma trận. Vì vậy, ta có thể giảm bớt chi phí tính toán bằng cách giới hạn lại phạm vi tìm đường xoắn tối ưu thay vì tìm trên toàn bộ ma trận. Hai ràng buộc về đường xoắn phổ biến là dải Sakoe-Chiba và hình bình hành Itakura. Trong phạm vi đề tài này, ràng buộc đối với đường xoắn này được gọi là cửa sổ xoắn (warping window).

3.1.1. Ràng buộc dải Sakoe-Chiba

Ràng buộc trên cửa sổ xoắn này được đề xuất bởi Sakoe và Chiba (1978) [6]. Ràng buộc này được mô tả như sau.

Gọi đường xoắn tối ưu là tập các ô trong ma trận gióng hàng của hai chuỗi thời gian:

W = w1, w2, …, wk, …, wK max(n, m) Km + n + 1

Trong đó wk = (i, j)k. Ràng buộc dải Sakoe-Chiba (Sakoe-Chiba Band) yêu cầu |i–

3.1.2. Ràng buộc hình bình hành Itakura

Ràng buộc hình bình hành Itakura (Itakura Paralelogram) được đề xuất bởi Itakura (1975) [8]. Ràng buộc hình bình hành Itakura cũng định nghĩa đường xoắn cũng bao gồm một tập các ô trong ma trận gióng hàng của hai chuỗi thời gian:

W = w1, w2, …, wk, …, wK max(n, m) Km + n + 1

Trong đó wk = (i, j)k. Ràng buộc Itakura Parallelogram yêu cầu |i – j| r, trong đó

r là một hàm biến thiên theo thời gian.

Hình 3-1.b minh họa hình dạng cửa sổ xoắn ứng với ràng buộc Hình bình hành Itakura.

Hình 3-1 Hai loại ràng buộc đối với đường xoắn: a) Dải Sakoe-Chiba và b) Hình bình hành Itakura. (nguồn: [5])

3.1.3. Dải Ratanamahatana-Keogh (dải R-K)

Ratanamahatana & Keogh (2004) [4] đã đề xuất dải Ratanamahatana-Keogh (dải R-K) dựa trên nhận xét rằng cửa sổ xoắn có thể có hình dạng không đồng nhất. Dải R-

K được đề xuất nhằm hai mục đích: tăng tốc việc tính toán khoảng cách DTW và nâng cao độ chính xác của quá trình phân lớp vì cửa sổ xoắn là kết quả học dựa trên tập dữ liệu mẫu. Hình 3-2.A trình bày một ví dụ của dải R-K khi so sánh với dải Sakoe-Chiba và Hình bình hành Itakura.

Hình 3-2 Hình dạng của các loại ràng buộc cửa sổ xoắn: A) Dải R-K,B) Dải Sakoe-Chiba, C) Hình bình hành Itakura. (nguồn: [4])

Để tìm ra dải R-K cho một tập dữ liệu, Ratanamahatana và các cộng sự xem bài toán này như một bài toán tìm kiếm cổ điển. Để sử dụng kỹ thuật tìm kiếm heuristic, cần phải đặc tả hướng tìm kiếm, như tìm kiếm tiến (forward), tìm kiếm lùi (backward) hay kết hợp hai hướng (bi-direction), trạng thái khởi động, hàm heuristic, các thao tác và phép kiểm tra cuối cùng. Tìm kiếm tiến bắt đầu với trạng thái là dải Sakoe-Chiba có kích thước bằng 0 (khoảng cách Euclid), còn tìm kiếm lùi bắt đầu với trạng thái là dải đồng nhất có kích thước bằng cạnh lớn nhất m.

Hình 3-3 Minh họa giải thuật tìm kiếm tiến sử dụng độ chính xác. (nguồn:[4])

Về mặt lý thuyết, ngưỡng có thể là một ô, nhưng ngưỡng này có thể gây ra tình trạng quá khớp (overfitting). Ratanamahatana và các cộng sự đề nghị ngưỡng có giá trị √ ⁄2, trong đó m là chiều dài của chuỗi dữ liệu nhập.

Ràng buộc đối với đường xoắn cho khoảng cách DTW

Sắp xếp tập huấn luyện

HIỆN THỰC VÀ THỬ NGHIỆM