Nhận diện motif dựa vào phương pháp chiếu ngẫu nhiên (Random

Một phần của tài liệu Ứng dụng nhận dạng motif hỗ trợ phân lớp dữ liệu chuỗi thời gian dùng độ đo xoắn thời gian động (Trang 43 - 45)

CHƯƠNG 3 : CÁC CÔNG TRÌNH CÓ LIÊN QUAN

3.4. Phát hiện motif cho dữ liệu chuỗi thời gian

3.4.2. Nhận diện motif dựa vào phương pháp chiếu ngẫu nhiên (Random

Projection Algorithm)

Năm 2003, Chiu và các cộng sự đã đề xuất phương pháp chiếu ngẫu nhiên để tìm kiếm motif [11].

Đầu tiên Chiu sử dụng phương pháp PAA để thu giảm số chiều. Sau đó, tác giả tiếp tục sử dụng phương pháp SAX để rời rạc hóa chuỗi dữ liệu đã được thu giảm.

Giả sử chúng ta có chuỗi thời gian T gồm 1000 điểm, chứa hai chuỗi con chiều dài 16 là T1 và T58 giống nhau , nhưng vì lý do nào đó xảy ra nhiễu ở vị trí 8 đến 12.

Đầu tiên chúng ta sẽ chọn ra các chuỗi con bằng cách sử dụng cửa sổ trượt n. Tiếp theo chúng ta sẽ dùng phương pháp PAA và SAX để biến đổi các chuỗi con thành các kí tự để thành lập ma trận . Chú ý rằng các chỉ số hàng của cho chúng ta vị trí các chuỗi con tương ứng trong T. Hình 3-14 minh họa quá trình này.

Hình 3-14Minh họa việc xây dựng ma trận với a=3, w=4 và n=16 Tiếp theo, chúng ta sẽ khởi tạo một ma trận đụng độ [985,985] có giá trị khởi đầu bằng 0.

Sau khi xây dựng ma trận chúng ta bắt đầu thực hiện phép chiếu ngẫu nhiên như sau:

 Chọn ngẫu nhiên hai cột của (Ví dụ trong hình 2.13, hai cột {1,2} được

chọn, hình 2.14 – hai cột {2,4} được chọn). Nếu giá trị của hai cột 1 và 2 của hai hàng i, j của chuỗi S giống nhau thì chúng ta vị trí [i,j] của ma trận va chạm sẽ được tăng lên một đơn vị.

 Lặp lại bước trên với một số lần nhất định, chúng ta sẽ có một ma trận đụng độ. Số bước lặp này lớn hay nhỏ tùy thuộc vào số kí tự được mã hóa và cửa sổ trượt trong giải thuật SAX. Nếu tất cả các giá trị trong ma trận S là giống nhau thì không có motif nào được tìm thấy. Ngược lại rất có thể là [58,1] là rất lớn so với các giá trị khác. Từ ma trận đụng độ này, chúng ta sẽ dễ dàng tìm được 1-motif của T.

Hình 3-15 và Hình 3-16 mô tả quá trình chọn ngẫu nhiên hai cột và thay đổi giá trị của ma trận đụng độ ở các vị trí tương ứng.

Hình 3-15: Trái) {1,2} được chọn ngẫu nhiên Phải) tăng giá trị của các ô tương ứng 1 đơn vị [11]

Hình 3-16: Trái) Cột {2,4} được chọn Phải) Tăng giá trị của vị trí tương ứng [11]

Nhược điểm của phương pháp này là ta phải chọn các thông số để thu giảm số chiều của PAA, số lượng các kí tự mã hóa trong SAX và chiều dài cửa sổ trượt w cho giải thuật chiếu ngẫu nhiên hợp lý. Nếu các thông số này không được chọn hợp lý thì chương trình chạy rất lâu, đồng thời có thể không tìm được motif.

Một phần của tài liệu Ứng dụng nhận dạng motif hỗ trợ phân lớp dữ liệu chuỗi thời gian dùng độ đo xoắn thời gian động (Trang 43 - 45)

Tải bản đầy đủ (PDF)

(94 trang)