R運i r衣c hóa d英 li羽u v 噂k"rj逢挨pi"rjƒr" SAX

Một phần của tài liệu Nhận dạng motif và bất thường trên dữ liệu chuỗi thời gian dựa vào kỹ thuật băm (Trang 38 - 40)

I QUY TV

3.2 R運i r衣c hóa d英 li羽u v 噂k"rj逢挨pi"rjƒr" SAX

D li u chu i th m s chi u b ng PAA, d li u

s ti p t c x lý r i r c hóa v chu i nh ng ký t r i r c b ng

SAX. V i d li u chu i th n hóa ng tuân theo m t xác su t phân b

chu n (Gaussian distribution) (Hình 3.2) .

Hình 3.2: M磯u d英 li羽w"8逢嬰c v胤 có tính ch医t tuy院n tính cho th医y d英 li羽u tuân theo phân b嘘 Gauss [19]

Khi d li phân b Gauss ta c nh nh m ng t (break point), cái mà s sinh ra a nh ng vùng có di n tích b ng cong Gauss.

A鵜pj"pij c";. Nhのpi"8kあm ngt (Breakpoints): nh m ng t là m t danh sách có

th t B = 1 a-1 i m phân b xác su t N(0,1) c ng cong Gauss, giá tr i i+1 = 1/a 0 = - a [19] (Hình 3.3).

Hình 3.3: B違ng th嘘pi"m‒"f́pi"8吋 tra nh英pi"8k吋m ng逸t theo phân b嘘 Gauss v噂i s嘘 vùng phân b嘘 t瑛5"8院n 10 [19]

T t c các h s PAA hi n có s c ánh x vào danh sách nh m ng t theo

s m ng t nh nh t

thì nó s c ánh x v i ký t a u nó l m ng t nh nh m ng t nh th nhì thì s c ánh x v i ký t b và

v y.

Hình 3.4: R運i r衣c hóa v隠 chu厩i ký t詠 cho m瓜t chu厩i có chi隠u dài n = 128, w = 8, a = 3 [19]

A鵜pj"pij c"32. T (Word): m t chu i con C có chi u dài n có th c bi u di n b ng m t t có w ký t 系實 = c賦1 c賦w i alphai là ký t th i trong b ng ký t alphabet (alpha1 = a, alpha2 ánh x t ng x p x PAA 系違 vào m t t ng 系實 ta s d ng công th c sau [19]:

c

賦i = alphaj 垣 j-1 c賦i < j (3.2)

Một phần của tài liệu Nhận dạng motif và bất thường trên dữ liệu chuỗi thời gian dựa vào kỹ thuật băm (Trang 38 - 40)

Tải bản đầy đủ (PDF)

(87 trang)