Butterworth.
B瓜 l丑e"8ƒr"泳ng xung vô h衣n (IIR-Infinite impulse response) bao g欝m b嘘n lo衣i là Butterworth, Chebyshev lo衣i I, Chebyshev lo衣i II và Elliptic. Lu壱p"x<p"u穎 d映ng b瓜
l丑c ph鰻 bi院n Dwvvgtyqtvj"8吋 l丑c nhi宇u cho tín hi羽w"8亥u vào."x·"8ƒr"泳ng trên mi隠n t亥n s嘘 c栄a nó ít nh医p nhô 荏 vùng t亥n s嘘 l医y m磯u [32].
Có hai b瓜 l丑c Butterworth 8逢嬰c s穎 d映ng là b瓜 l丑c thông th医p (low-pass filter) và b瓜 l丑c thông cao (high-pass filter).
Ü L丑c nhi宇u thông cao (Highpass filter):
B瓜 l丑c thông cao hay còn g丑i là b瓜 l丑c c逸t th医p, cho phép các t亥n s嘘ecq"j挨p"v亥n s嘘 c逸t qua b瓜 l丑c. L丑c thông cao lo衣i b臼 các thành ph亥n t亥n s嘘 th医p không mong mu嘘n kh臼i tín hi羽u ho員c lo衣i b臼 nhi宇u t亥n s嘘 th医p. Khi áp d映ng b瓜 l丑c High-pass v噂i FC = 0.3 Hz nh茨m lo衣i b臼 thành ph亥n nhi宇u t亥n s嘘 r医t th医p c栄a các tín hi羽w"8k羽n sinh h丑c. Quá trình này là c亥n thi院v"8吋 có th吋 phân bi羽t 8逢嬰c nhi宇w"x "zƒe"8鵜pj"8逢嬰c các t亥n s嘘
th医p có m員t trong mi隠n d英 li羽w"8cpi"zfiv"o "8員c bi羽t là các sóng ch壱m c栄a tín hi羽u EEG có t亥n s嘘 nh臼j挨p"6 Hz [32].
Ü B瓜 l丑c thông th医p (Low-pass filter):
B瓜 l丑c Low-pass cho phép các t亥n s嘘 th医r"j挨p"v亥n s嘘 c逸t FC8k"swc."eƒe"t亥n s嘘 cao
j挨p"v亥n s嘘 c逸t s胤 b鵜 ch員n l衣ị Lu壱p"x<p8«"u穎 d映ng l丑c thông th医p v噂i t亥n s嘘 c逸t 35 Hz
8嘘i v噂i tín hi羽w"GGI"x "97"J¦"8嘘i v噂i tín hi羽u ECG giúp lo衣i b臼 các tín hi羽u nhi宇u
pj逢"pjk宇w"8k羽p"e挨."pjk宇u tr逸ng [32].
3.3.4 Vt ej"zw医v"8員e"vt逢pi.
3.3.4.1 A員e"vt逢pi"v瑛 tín hi羽u EEG.
Ü Phép bi院p"8鰻i Wavelet r運i r衣c (DWT Î Discrete Wavelet Transform)
Phép bi院p"8鰻k"Ycxgngv"8逢嬰c phát tri吋p"pj逢"o瓜t công c映 mô t違 tín hi羽w"8欝ng th運i trên mi隠n th運i gian và t亥n s嘘 [33].
Phép bi院p"8鰻i Wavelet liên t映e"e„"pj逢嬰e"8k吋m là cung c医p s詠 ch欝ng chéo c栄a d衣ng
u„pi"dcp"8亥u, t瑛 8„"v衣o ra nhi隠u h羽 s嘘j挨p"o泳c c亥n thi院v"8吋 zƒe"8鵜nh tín hi羽u duy nh医t. S詠f逢"vj瑛a này có th吋 không ph違i là m瓜t v医p"8隠 trong các 泳ng d映ng phân tích
pj逢pi"u胤 khá m医t th運i gian khi khôi ph映c tín hi羽u g嘘c. Yêu c亥w"8員t ra là c亥n ch丑n m瓜t t壱p con các t益 l羽 và v鵜 trí nh茨m gi違m thi吋w"v pj"vqƒp0"N#"v逢荏ng nh医t là bi院p"8鰻i có cùng s嘘 8k吋m trong tín hi羽u g嘘e"pj逢"vt逢運ng h嬰p c栄a bi院p"8鰻i Fourier. Bi院p"8鰻i wavelet r運i r衣e"*FYV+"8衣v"8逢嬰c s詠 phân tách này b茨ng cách h衣n ch院 s詠 bi院p"8鰻i trong d鵜ch mã và t益 l羽."vj逢運pi"n "eƒe"n {"vj瑛a c栄a 2 [33]. FYV"f逢噂i d衣ng bi院p"8鰻i ph映c h欝i: 捲岫建岻 噺 布 布 穴岫倦 ゾ岻に貸賃態 岫に貸賃痛伐 ゾ岻 著 ゾ退貸著 著 賃退貸著 (3.1) Vtqpi"8„: a: H羽 s嘘 t益 l羽 (co giãn) b: H羽 s嘘 d鵜ch chuy吋n 倦 có quan h羽 v噂i"欠 欠 噺 に賃, 決 e„"nk‒p"swcp"8院n ゾ: 決 噺 に賃ゾ 穴岫倦 ゾ岻 là m瓜t m磯u c栄a 激岫欠 決岻 t衣k"eƒe"8k吋m r運i r衣c 倦 là hàm Wavelet ‚ Eƒe"d逢噂c th詠c hi羽n m瓜t bi院p"8鰻i Wavelet [33]:
- Phân tách tín hi羽u: Tín hi羽w"8亥u vào qua các b瓜 l丑c thông cao và thông th医r."ucw"8„"
tín hi羽u s胤8逢嬰e"8逢c"swc"d瓜 gi違m m磯u (down sampling) nh茨m gi違m t亥n s嘘 l医y m磯ụ
A亥u ra c栄a quá trình trên s胤vjw"8逢嬰c h羽 s嘘 x医p x雨 (Detail coefficient) - 泳ng v噂i thành
(Approximation coefficient) - 泳ng v噂i thành ph亥n t亥n s嘘 cao c栄a tín hi羽w"8員e"vt逢pi" ejq"8瓜 s逸ẹ"8瓜 nét và nhi宇u c栄a tín hi羽ụ Thành ph亥n t亥n s嘘 8逢嬰c tách ra d詠a trên nguyên t逸c Nyquist 峙 捗濡
態韮甜迭 捗濡
態韮峩v噂k"p"v逢挨pi"泳ng Dn theo t瑛ng m泳c. Quá trình phân tách tín hi羽u này g丑i là cây Wavelet.
- X穎 lý tín hi羽u: DWT có các h羽 s嘘 Wavelet ch泳a các giá tr鵜 quan tr丑pi"pj逢"p<pi" n逢嬰ng, hình d衣pị"8瓜pfiv."8瓜 s逸c và nhi宇u c栄a tín hi羽u mà d詠c"x q"8„"e„"vj吋 th詠c hi羽n các m映e"8 ej"mjƒe"pjcw"pj逢"pfip."mj穎 nhi宇u ho員c nh壱n d衣ng tín hi羽w.È0Tín hi羽u EEG có hai m映e"8 ej"ej pj"n "kh穎 nhi宇u 血 伴 ぬの Hz và kh穎 trôi 血 隼 ど の"Hz v逢挨pi"泳ng v噂i vùng t亥n s嘘 c栄a b嘘n lo衣i sóng não chính Delta, Theta, Alpha, Betạ
- Tái t衣o tín hi羽w<"Ucw"mjk"8逢嬰c x穎 lý (kh穎 nhi宇u, kh穎vt»k.È+, các h羽 s嘘8逢嬰c tái t衣o l衣i b茨pi"eƒej"8逢c"ej¿pi"swc"eƒe"d瓜 v<pi"o磯u, scw"8„"8逢c"swc"eƒe"d瓜 l丑c thông th医p và thông cao và cu嘘k"épi"vjw"8逢嬰c tín hi羽u sau x穎 lý. Quá trình tái t衣o có chu trình ng逢嬰c l衣i v噂i quá trình phân tách.
Ü Cây h羽 s嘘 Wavelet (Wavelet Packet Tree) [33]:
Trong các quá trình phân tách, ch雨 các tín hi羽u t亥n s嘘 th医r"8逢嬰c phân tách ti院p theo, cho th医y các d違i t亥n s嘘 l丑c n穎a trên pj逢"hình 3.10 (A). Quá trình phân tách này g丑i là cây logarit (logarithmic tree). Tuy nhiên, v磯n có các ki吋u phân tách khác, bao g欝m cây hoàn ch雨nh (complete tree) hay cân b茨ng (balanced tree) th吋 hi羽n c違 d違i t亥n s嘘 l丑c n穎c"f逢噂i pj逢"hình 3.10 (B).
Vtqpi"u挨"8欝 phân tách này, c違 tín hi羽u t亥n s嘘 cao (highpass - HP) và t亥n s嘘 th医p (lowpass Î LP) 8隠w"8逢嬰c ti院p t映c phân tách thành các tín hi羽u t亥n s嘘 cao và th医p cho
8院n tín hi羽u cu嘘ị Có th吋 có các c医u trúc cây khác linh ho衣v"j挨p."vtqpi"8„"sw{院v"8鵜nh phân tách ph映 thu瓜c vào ho衣v"8瓜ng c栄a tín hi羽u con quy院v"8鵜nh. Các hàm t益 l羽 và h羽
s嘘ycxgngv"8逢嬰c liên k院t v噂i nhau vào m瓜v"u挨"8欝 cây chung, g丑i là cây h羽 s嘘 wavelet (Wavelet Packet Tree - WPT).
Bi院p"8鰻k"Ycxgngv"e„"v pj"nkpj"8瓜ng cao vì có th吋 dùng nhi隠u h丑 Wavelet khác nhau sao cho thích h嬰p v噂k"d k"vqƒp"8吋 8衣t k院t qu違 phân tích t嘘t nh医t. M瓜t s嘘 h丑 Ycxgngv"vj逢運pi"8逢嬰c s穎 d映ng cho tín hi羽u EEG: Symlets (sym), Daubechies (db), Coiflets (coif).
Các d違i t亥n s嘘 c栄a tín hi羽w"GGI"8«"8逢嬰c kh穎 nhi宇w"8逢嬰c chia thành các d違i Delta (0.3 Hz - 4 Hz), Theta (4 Hz - 8 Hz), Alpha (8 Hz - 14 Hz) và Beta (14 Hz - 30 Hz).
A嘘i v噂k"8q"ik医c ng栄, có s詠 xu医t hi羽n c栄a Spindle (hi羽n di羽n trong ikck"8q衣n N2), và Spindle này có d違i t亥n riêng *vj逢運ng 12 Hz Î 14 Hz) [5]. Vì v壱y lu壱p"x<p"u穎 d映ng phép bi院p"8鰻k"Ycxgngv"8吋 tính toán các h羽 s嘘泳ng v噂i các 6 d違i t亥n là Delta, Theta, Alpha, Spindle, Beta1 và Beta2 b茨ng cách v胤u挨"8欝 cây h羽 s嘘 Wavelet (WPT+"8吋 th医y các m泳c phân tách có h羽 s嘘v逢挨pi"泳ng v噂i 6 vùng t亥n s嘘 mong mu嘘n.
Ü Phép bi院p"8鰻i Fourier:
Tín hi羽w"8k羽n não là tín hi羽u công su医t vì tín hi羽u có tính tu亥n hoàn trên mi隠n th運i gian v噂i chu k zƒe"8鵜nh, vì th院 mu嘘n phân tích, l丑c nhi宇u, nh壱n d衣ng nó c亥n ph違i chuy吋n qua mi隠n t亥n s嘘. Bi院p"8鰻i Fourier là phép bi院p"8鰻i tín hi羽u t瑛 mi隠n th運i gian sang mi隠n t亥n s嘘0"Vtqpi"n pj"x詠c x穎 lý tín hi羽u, bi院p"8鰻i Fourier r運i r衣c (DFT Î
院 鵜 vt "j pi"8亥 運 詠 欝 衣 壱 羽
qu違 c栄a bi院p"8鰻i Fourier r運i r衣e0"Vtqpi"8„."dk院p"8鰻i Fourier nhanh (FFT Î Fast Fourier Transform) là công c映 cho phép vi羽c tính toán bi院p"8鰻i DFT và Fourier r運i r衣e"pi逢嬰c (IDFT Î Inverse Discrete Fourier Transform) tr荏 nên nhanh chóng và hi羽u qu違 [33].
A鵜nh lý chu厩i Fourier có n隠n t違ng chính là ti院p c壱n c亥w"j·pj"ukp"8吋 phân tách b医t k d衣ng sóng nào, dù ph泳c t衣r"8院p"8¤w"vj pj"eƒe"j·pj"ukp"e„"épi"v亥n s嘘, ho員c b瓜i s嘘 c栄a t亥n s嘘 sóng d衣ng sóng0"E挨"u荏 này có th吋8逢嬰c bi吋u th鵜f逢噂i d衣ng m瓜t chu厩i
eƒe"j·pj"ukp"e„"dk‒p"8瓜 và góc pha thích h嬰p ho員c m瓜t chu厩k"eƒe"ukp"x "equkp"v逢挨pi" 8逢挨pi"x隠 m員t toán h丑c.
Bi院p"8鰻i Fourier c栄a hàm liên t映e"8逢嬰e"8鵜pj"pij c"d荏i công th泳c:
隙岫血岻 噺 豹 捲岫建岻結脹 貸珍態訂捗痛穴建 待 """""""" (3.2) V噂i 血 噺 伐タ 伐に血怠 伐血怠 ど 血怠 に血怠 タ 捲岫建岻: tín hi羽u trong mi隠n th運i gian 隙岫血岻: tín hi羽u trong mi隠n t亥n s嘘 (ph鰻 t亥n s嘘) 血怠 噺脹怠 , v噂i 劇 là chu kì c栄a d衣ng sóng 捲岫建岻
Theo lý thuy院t m磯u c栄a tín hi羽u và b違n ch医t c栄a tín hi羽w"v逢挨pi"v詠 vj·"8吋 quá trình s嘘j„c"8逢嬰e"ej pj"zƒẹ"d<pi"vj»pi"éc"v p"jk羽u ph違i có gi噂i h衣n và giá tr鵜 8„"n "
血陳銚掴 隼 血 に. Bi院p"8鰻i DFT cho hàm r運i r衣c, phép tích phân tr荏 thành t鰻ng và 建" 蝦 券劇鎚 46 Hình 3.11<"Dkxp"8ごk"Hqwtkgt [34] . DVpi" DVpi"vごpi"jぢr"eƒe"8pe"vt⇔pi"8⇔ぢe"uぬ"fつpi"vtqpi"nwfp"x<p Dkxp"8ごk"Hqwtkgt D違pi" D違pi"v鰻pi"j嬰r"eƒe"8員e"vt逢pi"8逢嬰e"u穎"f映pi"vtqpi"nw壱p"x<p
O»"vV"vjwfv"vqƒp"rj¤p"eつo"M DVpi" DVpi"vごpi"jぢr"eƒe"8pe"
vt⇔pi"8⇔ぢe"uぬ"fつpi"vtqpi"nwfp"x<p <"Dkxp"8ごk"Hqwtkgt
DVpi" DVpi"vごpi"jぢr"eƒe"8pe"vt⇔pi"8⇔ぢe"uぬ"fつpi"vtqpi"nwfp"x<p
隙岷兼峅 噺 布 捲岷券峅結貸珍態訂陳津 朝 朝貸怠 津退待 """" (3.3) Phép bi院p"8鰻k"Hqwtkgt"pi逢嬰c IDFT: 捲岷券峅 噺軽な 布 隙岷兼峅結珍態訂陳津 朝 朝貸怠 陳退待 (3.4)
Bi院p"8鰻i Fourier trong th運i gian ng逸n (STFT Î Short Time Fourier Transform) d詠a trên nguyên t逸c phân chia tín hi羽u thành t瑛pi"8q衣p"8栄 nh臼8吋 có th吋 xem tín hi羽u trên m厩k"8q衣n tín hi羽u là 鰻p"8鵜pj."ucw"8„."vj詠c hi羽n bi院p"8鰻i Fourier lên t瑛pi"8q衣n tín hi羽u này [33].
鯨劇繋劇岫建 血岻 噺 豹 捲岫酵岻拳岫建 伐 酵岻結著 貸態訂捗痛穴酵
貸著
(3.5)
Ph鰻 p<pi"n逢嬰ng (ESD Î Gpgti{"Urgevtcn"Fgpukv{+"n "p<pi"n逢嬰ng ch泳a trong tín hi羽w"v逢挨pi"v詠, 捲岫建岻e„"nk‒p"swcp"8院p"e逢運pi"8瓜 c栄a tín hi羽u bình ph逢挨pi"8逢嬰c tích h嬰p theo th運i gian:
継 噺 豹 捲岫建岻著 態穴建
貸著
(3.6)
Theo gi違 thuy院t c栄a Parseval:
豹 捲岫建岻著 態穴建
貸著 噺 豹 隙岫血岻著 態穴血
貸著
(3.7)
V噂i 隙岫血岻 b茨ng hàm m壱v"8瓜p<pi"n逢嬰ng theo t亥n s嘘
Ph鰻 công su医t (PSD Î Rqygt"Urgevtcn"Fgpukv{+"8逢嬰c tính b茨pi"d·pj"rj逢挨pi" e逢運pi"8瓜 c栄a bi院p"8鰻i Fourier (ho員c chu厩i Fourier) c栄a d衣ng sóng:
鶏鯨岫血岻 噺 隙岫血岻 態 (3.8)
Phép bi院p"8鰻i Fourier ch雨 cung c医p thông tin có tính toàn c映c và ch雨 thích h嬰p cho nh英ng tín hi羽u tu亥n hoàn, không ch泳c"eƒe"8瓜t bi院n ho員e"eƒe"vjc{"8鰻i không d詠
Ü Shannon entropy
Shannon entropy trong lu壱p"x<p"p {"8逢嬰c dùng mô t違 phân b嘘p<pi"n逢嬰ng c栄a các h羽 s嘘Ycxgngv"x "8逢嬰c tính toán theo công th泳c (3.9):
' 噺 伐 布 ®辿態غ"岫®辿態岻
辿 (3.9)
X噂k"® 噺 岷5怠 5態 5戴 5替 5泰 5滞峅"x "5怠 5態 5戴 5替 5泰 5滞"n亥p"n逢嬰v"n "xfie"v挨"v鰻pi" j嬰r"eƒe"j羽"u嘘"Ycxgngv"ejq"f違k"dgvc"4."dgvc"3."urkpfng."cnrjc."vjgvc"x "fgnvc0
Shannon entropy s胤 có giá tr鵜 ecq"vtqpi"ikck"8q衣n W và R, trong khi s胤 có giá tr鵜 th医p trong tr衣ng thái ng栄u¤w"*P5+."8員e"vt逢pi"p {"e pi"8逢嬰e"f́pi"8吋 x穎 lý tín hi羽u EEG trong khi ng栄 [4].
Ü Entropy hoán v鵜 (permutation entropy)
Entropy hoán v鵜8逢嬰e"f́pi"8吋8鵜pj"n逢嬰pi"8瓜 ph泳c t衣p cho m瓜t chu厩i th運i gian
8瓜ng [4] x "8逢嬰c tính toán theo công th泳c (3.10):
2' 噺 伐 布 ı岫鱈 辿岻 غ ı
辿退怠 岫 辿岻" (3.10) Giá tr鵜 l噂n nh医t c栄c"RG"n "3."e„"pij c"n "v医t c違 hoán v鵜 8隠u có xác su医t b茨ng nhau; giá tr鵜 nh臼 nh医t c栄a PE là 0, cho th医y chu厩i th運i gian r医v"8隠u nhaụ Nói cách khác, giá tr鵜 PE càng nh臼, thì chu厩i th運k"ikcp"e pi"8隠u [35].
Vi羽c tính toán entropy hoán v鵜 ch雨 ph映 thu瓜c vào vi羽c ch丑n m. Khi m quá nh臼
(m < 5+."u挨"8欝 s胤 không ho衣v"8瓜ng t嘘t vì ch雨 có m瓜t s嘘 tr衣ng thái riêng bi羽t cho các m磯u d英 li羽u GGI0"Vj»pi"vj逢運pị"8吋ijk"8k羽p"p«q"8欝 dài (ví d映 trong gi医c ng栄), giá tr鵜 m l噂p"8逢嬰e"逢w"vk‒p"j挨p0"Nghiên c泳u này l詠a ch丑n tính toán t医t c違 d英 li羽u EEG v噂i m = 4 [35].
Ü T益 l羽 công su医t các d違i sóng:
迎掴 噺デ 鶏鶏掴 (3.11)
V噂i x l亥p"n逢嬰t là Delta, Theta, Alpha, Spindle, Beta1 và Beta2.
鶏"岫航撃態岻 là công su医t ph鰻 tín hi羽u c栄a t鰻ng sáu lo衣i sóng 荏 cùng m瓜t kênh t衣i cùng m瓜t th運k"8k吋m. 3.3.4.2 A員e"vt逢pi"v瑛 tín hi羽u HRV - Ph鰻p<pi"n逢嬰ng HF và LF c栄a HRV: 鶏挑庁 噺鶏 鶏挑庁 痛墜痛銚鎮 伐 鶏蝶挑庁 (3.12) 鶏張庁 噺鶏 鶏張庁 痛墜痛銚鎮 伐 鶏蝶挑庁 (3.13) Vtqpi"8„<" 鶏蝶挑庁n "p<pi"n逢嬰pi"e栄c"f違k"XNH"*2"Î"2026+"J¦"vtqpi"o瓜v"grqej"*52ư 鶏挑庁n "p<pi"n逢嬰pi"e栄c"f違k"NH"*2026"Î"2037+"J¦"vtqpi"o瓜v"grqej"*52ư 鶏張庁n "p<pi"n逢嬰pi"e栄c"f違k"JH"*2037"Î"206+"J¦"vtqpi"o瓜v"grqej"*52ư 鶏痛墜痛銚鎮 n "p<pi"n逢嬰pi"v鰻pi"v瑛"*2"Î"2026+"J¦"vtqpi"o瓜v"grqej"*52ư
T鰻ng k院t l衣k."eƒe"8員e"vt逢pi"8逢嬰c s穎 d映ng trong lu壱p"x<p"dcq"i欝o"6:"8員e"vt逢pi" vjgq"rj逢挨pi"rjƒr"vj嘘ng kê h羽 s嘘 Wavelet t瑛 tín hi羽u EEG [4] x "4"8員e"vt逢pi"v瑛 tín hi羽u HRV [12]:
- A員e"vt逢pi"G3-E13 hi吋n th鵜 phân b嘘 t亥n s嘘 c栄a tín hi羽w."8員c vt逢pi"G36-E34 hi吋n th鵜 8瓜 bi院p"8鰻i trong phân ph嘘i t亥n s嘘0"A員e"vt逢pi"G57"*Ujcppqp"gpvtqr{+"8逢嬰c dùng mô t違 phân b嘘p<pi"n逢嬰ng c栄a các h羽 s嘘Ycxgngv0"A員e"vt逢pi"G58"*gpvtqr{"jqƒp"
v鵜+"8逢嬰e"f́pi"8吋8鵜pj"n逢嬰pi"8瓜 ph泳c t衣p cho m瓜t chu厩i th運k"ikcp"8瓜pi0"Eƒe"8員c vt逢pi"
E37-E48 ch栄 y院u bao g欝m các phép tính th嘘pi"m‒"8逢嬰c áp d映ng tr詠c ti院p cho chu厩i th運i gian [4].
D違pi"3.4: D違pi"v鰻pi"j嬰r"eƒe"8員e"vt逢pi"8逢嬰e"u穎"f映pi"vtqpi"nw壱p"x<p
O»"v違"vjw壱v"vqƒp"rj¤p"e映o"M D違pi" D違pi"v鰻pi"j嬰r"eƒe" 8員e"vt逢pi"8逢嬰e"u穎"f映pi"vtqpi"nw壱p"x<p
O»"vV"vjwfv"vqƒp"rj¤p"eつo"M
<"A逢運pi"rj¤p"ejkc"f英"nk羽w"v衣k"eƒe"vt逢運pi"j嬰r"mj»pi"oqpi"ow嘘p"mjk" u穎" f映pi" UXO" rjk" vw{院p" v pjJ·pj" 50 O»" v違" vjw壱v" vqƒp" rj¤p" e映o" M
D違pi" D違pi"v鰻pi"j嬰r"eƒe"8員e"vt逢pi"8逢嬰e"u穎"f映pi"vtqpi"nw壱p"x<p
O»"v違"vjw壱v"vqƒp"rj¤p"e映o"M D違pi" D違pi"v鰻pi"j嬰r"eƒe" 8員e"vt逢pi"8逢嬰e"u穎"f映pi"vtqpi"nw壱p"x<p
3.3.5 Ej丑p"n丑e"8員e"vt逢pi"d茨pi"vjw壱v"vqƒp"OTOT"*Minimum Redundancy Maximum Relevance).
Sau khi trích xu医v"8員e"vt逢pị"d逢噂c ti院p theo c栄a H丑c máy là gi違m và l詠a ch丑p"8員c
vt逢pị"8k隠u này quan tr丑pi"x·"n o"v<pi"jk羽u su医t c栄a b瓜 phân lo衣k"e pi"pj逢"vtƒpj"v·pj"
tr衣ng over-fitting. Thu壱t toán ch丑n l丑e"8員e"vt逢pi"OTOT"f́pi"8吋 ch丑n m瓜t t壱p h嬰p các 8員e"vt逢pi"p鰻i tr瓜i nh医t gi英a ba l噂p. Thu壱v"vqƒp"p {"e„"zw"j逢噂ng ch丑n m瓜t t壱p h嬰p
eqp"eƒe"8員e"vt逢pi"e„"o嘘k"v逢挨pi"swcp"pjk隠u nh医t v噂i m瓜t l噂p (m泳e"8瓜 liên quan) và
v"v逢挨pi"swcp"pj医t gi英a chúng (s詠f逢"vj瑛a). A吋 h衣n ch院 vi羽c ch丑p"eƒe"8員e"vt逢pi"vtqpi"
m瓜t vài m磯u, quy trình xác th詠c chéo K-hqnf"8«"8逢嬰c áp d映ng. Quy trình xác th詠c chéo K-fold s胤8逢嬰e"8隠 c壱p trong m映c 3.3.7.2.
Ü Thông tin chung 荊 (Mutual information):
Thông tin chung gi英a hai bi院p"8q"n逢運ng m泳e"8瓜 không ch逸c ch逸n c栄a m瓜t bi院n có th吋8逢嬰c gi違m b茨ng cách bi院t bi院n còn l衣ị Thông tin chung 荊"c栄a bi院n ng磯u nhiên r運i r衣c 隙 và 傑8逢嬰e"8鵜pj"pij c<" 荊岫隙 傑岻 噺 布 鶏岫隙 噺 捲沈 傑 噺 権珍岻健剣訣鶏岫隙 噺 捲鶏岫隙 噺 捲沈 傑 噺 権珍岻 沈岻鶏岫傑 噺 権珍岻 沈 珍 (3.14) N院u 隙 và 傑8瓜c l壱p thì 荊 噺 ど. N院u 隙 và 傑 là cùng bi院n ng磯u nhiên, thì 荊"là entropy c栄a 隙 Ü Thu壱t toán MRMR [36]:
Nguyên t逸c c栄a thu壱t toán là tìm m瓜t t壱p h嬰r"eƒe"8員e"vt逢pi"v嘘k"逢w"pj逢pi"n衣k"v逢挨pi"
quan và khác nhau nhi隠u nh医t, t瑛8„"e„"vj吋8衣i di羽n cho bi院p"8ƒr"泳ng hi羽u qu違. Thu壱t toán s胤 gi違m s詠 f逢"vj瑛a c栄a m瓜t t壱r"8員e"vt逢pi"e pi"pj逢"v嘘k"逢w"j„c"u詠 v逢挨pi"swcp
c栄a t壱r"8員e"vt逢pi"8„"x噂i bi院p"8ƒr"泳ng. Vi羽c s穎 d映ng MRMR cho các bài toán phân lo衣i b茨ng cách s穎 d映ng thông tin chung c栄a các bi院n Î thông tin chung theo c員r"8員c
M映e"8 ej"e栄a MRMR là tìm ra t壱p 鯨 t嘘k"逢w"e栄c"eƒe"8員e"vt逢pi"o "t嘘k"8c"ikƒ"vt鵜 撃聴
(s詠v逢挨pi quan gi英c"U"8嘘i v噂i bi院p"8ƒr"泳ng y) và gi違m thi吋u giá tr鵜 激聴 (s詠f逢"vj瑛a c栄a S). Mjk"8„撃聴 và 激聴 8逢嬰c 8鵜pj"pij c"vjgq"e»pi"vj泳c (3.15) và (3.16): 撃聴 噺 な鯨 布 荊岫捲 検岻 掴樺聴 (3.15) 激聴 噺 鯨な態 布 荊岫捲 権岻 掴 佃樺聴 (3.16) Vtqpi"8„" 鯨 là s嘘8員e"vt逢pi"e„"vtqpi"v壱p 鯨.
A吋 v·o"8逢嬰c t壱p S t嘘k"逢w"e亥n xét t医t c違 に智 k院t h嬰r."vtqpi"8„" là toàn t壱r"8員c
vt逢pi. Vjc{"x q"8„."vjw壱t toán MRMR x院p h衣pi"eƒe"8員e"vt逢pi"vj»pi"swc"u挨"8欝 c瓜ng d欝n, kèm tính toán 頚岫 5 岻 b茨ng cách s穎 d映ng giá tr鵜 vj逢挨pi"u嘘 thông tin chung (MIQ Î Mutual Information Quotient):
警荊芸掴 噺激撃掴
掴
(3.17)
Vtqpi"8„"撃掴 và 激掴 l亥p"n逢嬰t là s詠v逢挨pi quan và s詠f逢"vj瑛a c栄a m瓜v"8員e"vt逢pi<
撃掴 噺 荊岫捲 検岻 (3.18)
激掴 噺 な鯨 布 荊岫捲 権岻
佃樺聴
(3.19)
Lu壱p"x<p"u穎 d映ng hàm fscmrmr c栄a Matlab, hàm này s穎 d映pi"8鵜pj"pij c"8吋 tính toán thông tin chung cho c違 bi院n phân lo衣i (r運i r衣c) và liên t映c. Hàm s胤 x院p h衣ng các
8員e"vt逢pi"vtqpi"v壱p và tr違 k院t qu違 trong bi院n idx (ch雨 s嘘 c栄a các 8員e"vt逢pi8逢嬰c s逸p x院p theo m泳e"8瓜 quan tr丑ng c栄a 8員e"vt逢pi+0"Eƒe"d逢噂c th詠c hi羽n c栄c"j o"8逢嬰c mô t違
3.3.6 Rj¤p"e映o"eƒe"ikck"8q衣pik医e"pi栄d茨pi"vjw壱v"vqƒp"rj¤p"e映o"M-means.
Phân c映m K-means là m瓜v"rj逢挨pi"rjƒr"rj¤p"nq衣i thu瓜c nhóm Unsupervised Learning (H丑c không giám sát) trong H丑c máy."8逢嬰c James MacQueen s穎 d映ng l亥n
8亥w"vk‒p"x q"p<o"3;89 [38], m員e"f́"#"v逢荏pi"p {"8«"swc{"vt荏 l衣i v噂i Hugo Steinhaus
x q"p<o"3;780"Vjw壱t toán tiêu chu育p"8逢嬰e"8隠 xu医t l亥p"8亥u tiên b荏i Stuart Lloyd c栄a
Dgnn"Ncdu"x q"p<o"3;79"pj逢"n "o瓜t k悦 thu壱v"8k隠u ch院 mã xung, m員c dù nó không
8逢嬰c xu医t b違p"pj逢"o瓜v"d k"dƒq"ejq"8院p"p<o"3;:40"P<o"3;87."G0"Y0"Hqti{"zw医t b違n v隠 cùng m瓜v"rj逢挨pi"rjƒr."8„"n "n#"fq"v衣k"ucq"8»k"mjk"p„"8逢嬰c g丑i là Lloyd-Forgỵ
Rj逢挨pi"rjƒr"rj¤p"e映m b茨ng thu壱t toán K-ogcpu"8逢嬰c s穎 d映ng khá r瓜ng rãi b荏i có nguyên lý ho衣v"8瓜ng d宇 hi吋u, kh違 p<pi"z穎 n#"n逢嬰ng s嘘 li羽u l噂n và linh ho衣t trong vi羽c mô hình hóạ
Khái ni羽o"e挨"d違n v隠 phân c映m: là các quy vt·pj"v·o"eƒej"pj„o"eƒe"8嘘k"v逢嬰ng
8«"ejq"x q"eƒe"e映o"*enwuvgtự"ucq"ejq"eƒe"8嘘k"v逢嬰ng trong cùng 1 c映o"v逢挨pi"v詠 *ukoknct+"pjcw"x "eƒe"8嘘k"v逢嬰ng khác c映o"vj·"mj»pi"v逢挨pi"v詠 (Dissimilar) nhaụ M映c
8 ej"e栄a phân c映m là tìm ra b違n ch医t bên trong các nhóm d英 li羽u [39].
Mô t違 ng逸n g丑n nguyên t逸c tính toán c栄a thu壱t toán phân c映m K-ogcpu"pj逢"
hình 3.12:
- Ch丑n ng磯u nhiên K tâm (centroid) cho K c映m (cluster). M厩i c映o"8逢嬰e"8衣i di羽n b茨ng tâm c栄a c映m.
- Tính kho違ng cách gi英c"eƒe"8嘘k"v逢嬰pi"*qdlgevư"8院p"M"v¤o"*vj逢運ng dùng kho違ng cách Euclid)
- Pj„o"eƒe"8嘘k"v逢嬰ng vào nhóm g亥n nh医t - Zƒe"8鵜nh l衣i tâm m噂i cho các nhóm
- Th詠c hi羽n l衣k"d逢噂e"4"ejq"8院n khi không có s詠vjc{"8鰻i nhóm nào c栄a các
E„"P"8k吋m d英 li羽u trong t壱p training 8逢嬰c ghép l衣i thành 隙 噺 岷捲怠 捲態 捲朝峅 樺 "温鳥抜朝 và 計 隼 軽 là s嘘enwuvgt"8逢嬰e"zƒe"8鵜pj"vt逢噂c. Vi羽c c亥n làm là tìm các centroid
兼怠 兼態 兼懲 樺 " 温鳥抜怠 và label c栄a m厩k"8k吋m d英 li羽ụ K-ogcpu"enwuvgtkpi"dcp"8亥u không có label c映 th吋, nhi羽m v映n "8k"v·o"ncdgn"e栄c"ej¿pi"ucq"ejq"eƒe"8k吋m có cùng label n茨m g亥n nhau, t衣o thành m瓜t cluster.
V噂i m厩k"8k吋m d英 li羽u 捲沈, c亥n tìm label 検沈 噺 倦 c栄a nó, 荏8¤{"倦" 樺 岶な に 計岼. M瓜t k悦 thu壱v"vj逢運pi"8逢嬰e"f́pi"8吋 bi吋u di宇n label này có tên là one Î hot coding. M厩i label 倦8逢嬰c thay th院 b茨ng m瓜t vector hàng 検沈 樺 温怠抜懲Î8逢嬰c g丑i là label vector,
vtqpi"8„"v医t c違 các ph亥n t穎 c栄a 検沈 b茨ng 0, ngo衣i tr瑛 ph亥n t穎荏 v鵜 trí th泳 k b茨ng 1. C映
th吋, 検沈珍 噺 ど 褐倹 塙 倦 検沈珍 噺 な. Khi ch欝ng các vector 検沈 lên nhau t衣o thành m瓜t ma tr壱n label 桁 樺 温朝抜懲 và ph亥n t穎検沈珍 là ph亥n t穎 hàng th泳件, c瓜t th泳倹 c栄a ma tr壱p"[."x "8欝ng