I QUY TV
3.2 R運i r衣c hóa d英 li羽u v 噂k"rj逢挨pi"rjƒr" SAX
D li u chu i th m s chi u b ng PAA, d li u
s ti p t c x lý r i r c hóa v chu i nh ng ký t r i r c b ng
SAX. V i d li u chu i th n hóa ng tuân theo m t xác su t phân b
chu n (Gaussian distribution) (Hình 3.2) .
Hình 3.2: M磯u d英 li羽w"8逢嬰c v胤 có tính ch医t tuy院n tính cho th医y d英 li羽u tuân theo phân b嘘 Gauss [19]
Khi d li phân b Gauss ta c nh nh m ng t (break point), cái mà s sinh ra a nh ng vùng có di n tích b ng cong Gauss.
A鵜pj"pij c";. Nhのpi"8kあm nght (Breakpoints): nh m ng t là m t danh sách có
th t B = 1 a-1 i m phân b xác su t N(0,1) c ng cong Gauss, giá tr i i+1 = 1/a 0 = - a [19] (Hình 3.3).
Hình 3.3: B違ng th嘘pi"m‒"f́pi"8吋 tra nh英pi"8k吋m ng逸t theo phân b嘘 Gauss v噂i s嘘 vùng phân b嘘 t瑛5"8院n 10 [19]
T t c các h s PAA hi n có s c ánh x vào danh sách nh m ng t theo
s m ng t nh nh t
thì nó s c ánh x v i ký t a u nó l m ng t nh nh m ng t nh th nhì thì s c ánh x v i ký t b và
v y.
Hình 3.4: R運i r衣c hóa v隠 chu厩i ký t詠 cho m瓜t chu厩i có chi隠u dài n = 128, w = 8, a = 3 [19]
A鵜pj"pij c"32. Tな (Word): m t chu i con C có chi u dài n có th c bi u di n b ng m t t có w ký t 系實 = c賦1 c賦w i alphai là ký t th i trong b ng ký t alphabet (alpha1 = a, alpha2 ánh x t ng x p x PAA 系違 vào m t tな ng 系實 ta s d ng công th c sau [19]:
c
賦i = alphaj 垣 j-1 c賦i < j (3.2)