Symbolic Aggregate ApproXimation (SAX)

Một phần của tài liệu Ứng dụng giải thuật sax và matrix profile để phát hiện bất thường trong phân tích dữ liệu điện tâm đồ (Trang 46 - 55)

3.1 .ăLỦăthuy tăliênăquan

3.1.1. Symbolic Aggregate ApproXimation (SAX)

Ph ngăphápăx păx ăg păkỦăhi uăhóa (SAX) [6] lƠăm tăph ngăphápăđ iădi nă choăcácăph ngăphápăti păc năd aătrênătìmăki măt ngăt .SAXălƠăm tăk ăthu tăbi uă t ngăchuy năđ iăd ăli uăthƠnhăm tăchu iăcácăb ngăch ăcáiăvƠătínhătốnăkho ngăcáchă Euclideăt iăthi uăgi aăcácăchu iăconăđ ăxácăđ nhăđ ăgi ngănhauăc aăchúng.H năn a,ă ph ngăphápăSAXăs ăd ngăph ngăphápăx păx ăt ngăh pătheoăm nhă(PAA) [39] đ ă phơnăvùngăd ăli uăthƠnhăcácăphơnăđo năcóăkíchăth căb ngănhauăvƠătínhătốnăcácăgiáă tr ătrungăbìnhălƠăđ iădi năc aăt ngăphơnăđo n.

PAAălƠăm tăph ngăphápăbi uădi năkhơngăthíchă ngăv iăd ăli uălƠmăgi măkíchă th căc aăd ăli uăb ngăcáchăs ăd ngăgiáătr ătrungăbìnhăc aăcácăđi măd ăli uăđ ăbi uă di năphơnăđo năcóăkíchăth căb ngănhau.K ăthu tăPAAătr căh tăphơnăvùngăd ăli uă thƠnhăcácăchu iăconăcóăđ ădƠiăb ngănhau.ăGiáătr ătrungăbìnhăc aăm iădưyăconăđ că tínhătốnăvƠăs ăd ngălƠmăđ iădi năchoădưyăcon.ăSauăđó,ăSAXăs ăchuy năđ iăt ngădưyă conăthƠnhăm tăbi uădi năt ngătr ng.

34

Ph ngăphápăPAAătu năt ăx păx ăk giáătr ăli năk ănhauăthƠnhăcùngăm tăgiáătr ă b ngătrungăbìnhăc ngăc aăk đi măđó.ăQătrìnhăc ăti păt cănh ăv yăt ătráiăsangăph i.ă K tăqu ăcu iăcùngălƠăđ ngăth ngăcóăd ngăb căthang.

Hình 3.1: M t ví d v chu i th i gian #1 và ph ng pháp PAA v i 7 đi m. [40]

SAXăchoăphépăgi măm tăchu iăth iăgianăcóăđ ădƠiătùyăỦănăthƠnhăchu iăcóăđ ă dƠiătùyăỦăw,ă(wă<ăn,ăth ngălƠăwă<<ăn).ăKíchăth căb ngăch ăcáiăc ngălƠăm tăs ă nguyênătùyăỦăa,ătrongăđóăaă>ă2.ăB ngă3.1 th ăhi năph nătómăt tăkỦăhi uăchínhăđ căs ă d ngătrongăph nănƠyăvƠăcácăph năti pătheo. [6]

B ngă3.1:ăTómăt tăcácăkỦăhi uC Chu i th i gian C Chu i th i gian

Ph ngăphápăx păx ăt ngăh pătheoăt ngăm nhăc aăm tăchu iăth iăgian Bi uăt ngăđ iădi năchoăm tăchu iăth iăgiană

35

a Kíchăth c b ng ch cái (ví d cho b ng ch cái = {a,b,c},

Thôngăquaăchu iăth iăgianăthôăvƠăchu iăkỦăhi u,ăđ uătiênăth căhi năchuy năđ iă d ăli uăb ngăph ngăphápăx păx ăt ngăh păt ngăm nhă(PAA)ăđ ăgi măs ăchi uăc aă chu iăth iăgian,ăsauăđóăbi uădi năPAAăthƠnhăm tăchu iăr iăr c.

Gi măkíchăth căquaăPAA

ụăt ngăc aăph ngăphápăx păx ăg păt ngăđo nălƠătu năt ăx păx ăkăgiáătr ăli năk ă nhauăthƠnhăm tăgiáătr ,ălƠăgiáătr ătrungăbìnhăc ngăc aăkăgiáătr ăđó.ăTh ănh t,ăchu iăth iă gianăg căđ căchu năhóa,ăvƠăsauăđóăchu iăth iăgianăchu năhóaănƠyăđ căchiaăthƠnhă cácăphơnăđo năb ngănhauăg măkăgiáătr .ăQătrìnhăphơnăđo nănƠyăđ căb tăđ uăt ăđ uă chu iăth iăgianăchoăđ năcu iăchu iăth iăgianăvƠăcácăphơnăđo năsinhăraăkhôngăch ngă chéoăv iănhau.ăCu iăcùng,ăm iăphơnăđo năđ căbi uădi năb iăgiáătr ătrungăbìnhăc ngă c aăkăgiáătr ătrongăphơnăđo n.

Chu iăth iăgianăC cóăđ ădƠiăn cóăth ăđ căbi uădi năd iăd ngăw - khơng gian

chi uăb iăm tăvect ă . Y u t ith c a đ c tính b iăph ngătrìnhăsau:

Cácăphơnăđo n b ngănhauănƠyăđ c g i là các khung. M iăphơnăđo năđ c bi u di n b i giá tr trung bình c ng c aănó.ăVect ăc a các giá tr trung bình c ng c a cácăphơnăđo n bi u di n chu i th i gian thu gi m c a chu i th i gian g c C. K t qu c a quá trình thu gi m s chi uăPAAălƠăđ ng th ng có d ng b c thang.

Nói m tă cáchă đ nă gi n,ă đ gi m chu i th i gian t n chi u xu ng w th ngun, d li uăđ căchiaăthƠnhăwăắkhung”ăcóăkíchăth c b ng nhau. Giá tr trung bình c a d li u n mătrongăkhungăđ c tính tốn và m tăvect ăc a các giá tr này tr thành bi u di n gi m d li u. Bi u di n có th đ căhìnhădungănh ăm t n l căđ c

36

tính chu i th i gian g c v i s k t h p tuy n tính c aăcácăhƠmăc ăs nh ăth hi n trong hình 3.2 d iăđơy.

Hình 3.2: Bi u di n PAA có th đ c hình dung nh m t n l c mơ hình chu i th i gian v i s k t h p tuy n tính c a các hàm c s h p. Trong tr ng h p này, m t

chu i chi u dài 128 đ c gi m xu ng còn 8 chi u.

S ăphơnăđo năm lƠăthamăs ădoăng iădùngăxácăđ nh,ăkhiăm = N thìăchu iăth i gianăthuăgi măs ăgi ngăv iăchu iăth iăgianăg c.ăPh ngăphápăPAAăkháătr căquanăvƠ đ năgi nătrongătínhătốnăvƠănóăđưăđ căch ngăminhălƠăr tăh uăhi u,ăthíchăh păvƠăh tr ă cácă ph ngă phápă tínhă kho ngă cáchă khácă nh :ă kho ngă cáchă Euclid,ă DTW, Minkowski.

Vi căgi măkíchăth căPAAălƠătr căquanăvƠăđ năgi n,ănh ngăđưăđ căch ngă minhălƠăcóăth ăsoăsánhăv iăcácăk ăthu tăgi măkíchăth căph căt păh nănh bi năđ iă Fourier và wavelet [41], [42], [43].

37

Th căhi năchu năhóaăm iăchu iăth iăgianăđ ăcóăgiáătr ătrungăbìnhăb ngă0ăvƠăđ ă l chăchu năb ngăm tătr căkhiăchuy năđ iănóăthƠnhăbi uădi năPAA,ăvìătaăhi uărõăr ngă vi căsoăsánhăchu iăth iăgianăv iăcácăhi uăs ăvƠăbiênăđ ăkhácănhauălƠăvôăngh a. [42]

R iăr căhóa

R iăr căhóaă(discretization)ăchu iăth iăgianălƠăqătrìnhăbi năđ iăchu iăth iăgiană thƠnhăm tăchu iăcácăkỦăt ăđ ăcóăth ăápăd ngăcácăk ăthu tăx ălỦătrên d ăli uăchu iăkỦă t ăđ ăth căhi năx ălỦ,ăphơnătíchăd ăli uăchu iăth iăgian.

Sauăkhiăchuy năđ iăc ăs ăd ăli uăchu iăth iăgianăthƠnhăPAA,ăchúngătaăcóăth ăápă d ngăm tăphépăchuy năđ iăkhácăđ ăcóăđ căm tăbi uădi năr iăr c.ăNg iătaămongă mu năcóăm tăk ăthu tătùyăbi năđ ăt oăraăcácăkỦăhi uăcóătínhăt ngăđ ngă[44], [45]. i uănƠyăd ădƠngăđ tăđ căvìăchu iăth iăgianăchu năhóaăcóăphơnăph iăGaussian.ă[46] ăminhăh aăđi uănƠy,ăta tríchăxu tăcácădưyăconăcóăđ ădƠiă128ăt ă8ăchu iăth iă gianăkhácănhauăvƠăv ăbi uăđ ăxácăsu tăbìnhăth ngăc aăd ăli uănh ătrongăhình 3.3.

Hình 3.3: Bi u đ xác su t thơng th ng c a phân ph i tích l y các giá tr t các

dãy con có đ dài 128 t 8 t p d li u khác nhau. B n ch t tuy n tính cao c a bi u

38

Choăr ngăchu iăth iăgianăchu năhóaăcóăphơnăb ăGaussianăcao,ăchúngătaăcóăth ă đ năgi năxácăđ nhăcácă"đi măng t"ăs ăt oăraăcácăkhuăv căcóăkíchăth căb ngănhau d iăđ ngăcongăGaussian [46].

nhăngh aă1.ă i m ng t:ăđi m ng t là m t danh sách các s đ c s p x p sao cho khu v căd i m tăN(0,1)ăđ ng cong Gaussian t đ n ( và đ căđ nhăngh aălƠăt đ n ,ăt ngă ng)

Cácăđi m ng t này có th đ căxácăđnh b ng cách tra c u chúng trong b ng th ng kê. Ví d , hình 3.4 cung c păcácăđi m ng t cho các giá tr c a a t 3ăđ n 10.

Hình 3.4: M t b ng tra c u có ch a các đi m ng t chia phân ph i Gaussian theo m t s tùy ý (t 3 đ n 10) c a các vùng t ng đ ng [6].

Khiăđưăcóăđ căcácăđi m ng t, chúng ta có th tùy ch nh chu i th i gian theo cáchăsau.ă uătiênăchúngătaăcóăđ c PAA c a chu i th i gian. T t c các h s PAA n măd iăđi m ng t nh nh tăđ c ánh x t i ký hi uăắa”,ăt t c các h s l năh nă ho c b ngăđi m ng t nh nh t và nh h nđi m ng t nh nh t th haiăđ c ánh x t i ký hi uăắb,”ăv.v.ăHìnhă3.5 minh h a ý ki n.

39

Hình 3.5: Chu i th i gian đ c tùy ý b ng cách đ u tiên l y x p x PAA và sau đó s d ng các đi m ng t xác đ nh tr c đ ánh x các h s PAA thành các ký hi u

SAX. Trong ví d trên, v i n = 128, w = 8 và a = 3, chu i th i gian đ c ánh x thành t baabccbc. [6]

Trongăvíăd ănƠy,ă3ăkỦăhi uăắa,”ăắb”ăvƠăắc”ăt ngăđ ngănhauănh ăchúngătaă mongămu n.ăChúngătôiăg iăvi căn iăcácăkỦăhi uăđ iădi năchoăm tădưyăconălƠăm tăt .

nhăngh aă2. T : M tădưyăconăCăcóăđ dài n có th đ c bi u di năd i d ng m t t nh ăsau.ăG i alphai bi u th ph n t th i c a b ng ch cái, t c là alpha1 = a và alpha2 =ăb.ăSauăđó,ăánhăx t m t x p x PAA đ n m t t thuăđ c nh ăsau:

Bây gi chúngătaăđưăđ nhăngh aăSAX,ăbi u di năt ngătr ngăc a chúng ta (bi u di n PAA ch là m tăb c trung gian c n thi tăđ cóăđ c bi u di năt ng tr ng).

40  Cácăphépăđoăkho ngăcách

Hình 3.6: B ng tra c u đ c s d ng b i hàm MINDIST. B ng này dành cho b ng ch cái có s l ng là 4, t c là a = 4. Kho ng cách gi a hai ký hi u có th đ c

đ c b ng cách ki m tra hàng và c t t ng ng. Ví d , dist (a, b) = 0 và dist (a, c) = 0,67. [6]

41

Hình 3.7: Tr c quan c a ba bi u di n đ c th o lu n, và các th c đo kho ng cách

đ c xác đ nh trên chúng.

A) Kho ng cách Euclide gi a hai chu i th i gian có th đ c hình dung d i d ng

c n b c hai c a t ng bình ph ng hi u s c a m i c p đi m t ng ng.

B) S đo kho ng cách đ c xác đ nh cho phép x p x PAA có th đ c coi là c n b c hai c a t ng bình ph ng chênh l ch gi a m i c p h s PAA t ng ng, nhân v i

c n b c hai c a t c đ nén.

C) Kho ng cách gi a hai bi u di n SAX c a m t chu i th i gian yêu c u tra c u kho ng cách gi a t ng c p ký hi u, bình ph ng chúng, tính t ng, l y c n b c hai và cu i cùng nhân v i c n b c hai c a t c đ nén. [6]

42

Nh ăv y,ăSAXălƠăm tăph ngăphápăhi uăqu ăvƠăh uăíchătrongăvi cătruyăv nă cácăchu iăconăc aăchu iăth iăgianăvƠăc ngăcóăth ăđ căs ăd ngătrongănhi uăho tăđ ngă khaiăthácăd ăli uăchu iăth iăgian,ăbaoăg măphơnănhómăvƠăphơnălo iăm u.

Một phần của tài liệu Ứng dụng giải thuật sax và matrix profile để phát hiện bất thường trong phân tích dữ liệu điện tâm đồ (Trang 46 - 55)

Tải bản đầy đủ (PDF)

(86 trang)