Tín hiệu điện não cần được tiền xử lý trước khi tiến hành trích chọn đặc trưng và đưa vào mơ hình phân loại để dự đốn tín hiệu điện não của bệnh nhân tâm thần
24
phân liệt. Việc tiền xử lý nhằm tách tín hiệu cĩ ích (EEG) ra khỏi các tín hiệu gây
nhiễu khác (nhiễu trắng, tín hiệu điện tim, tín hiệu điện mắt, tín hiệu điện cơ, …). Việc tách các tín hiệu này khơng thể sử dụng các bộ lọc số, do các tín hiệu trên cĩ phổ tần trùng nhau. Vì thế cần sử dụng các phương pháp thống kê nhằm tách các nguồn tín hiệu ban đầu ra khỏi nhau.
Khi tín hiệu quan sát được là tổng các nguồn tín hiệu ở các khoảng tần số khác nhau, bằng việc sử dụng các bộ lọc số ta cĩ thể tách các nguồn ban đầu riêng biệt. Tuy nhiên, với các tín hiệu là tổng hợp của nhiều nguồn cĩ phổ tần trùng nhau, việc tách các nguồn tín hiệu ban đầu gặp nhiều khĩ khăn. Khi đĩ phân tách các nguồn tín hiệu dựa trên phương pháp thống kê như phân tích thành phần độc lập cho thấy kết quả phân tách đạt hiệu quả.
Tín hiệu điện não thu được cĩ đặc điểm làphổ tần trùng với một số tín hiệu
nội sinh khác như tín hiệu điện mắt, tín hiệu điện tim, tín hiệu điện cơ. Vì thế, khơng thể áp dụng các bộ lọc số để loại bỏ các tín hiệu gây nhiễu. Việc áp dụng
phương pháp phân tích thành phần độc lập để loại bỏ các tínhiệu nhiễu trên là cần
thiết.
Hình 3. 4.Phổ tần các tín hiệu y sinh [45]
ICA là thuật tốn giúp phân tách tín hiệu đa biến (multivariate signal) thành
các thành phần con dựa trên giả sử độc lập thống kê lẫn nhau của các nguồn tín
hiệu non-Gauss. Phân tích thành phần độc lập (ICA) của một vectơ ngẫu nhiên là
25 Phân tích thành phần độc lập được sử dụng cho mục đích đánh giá các nguồn
tín hiệu ban đầu chỉ thơng qua các tín hiệu thu được mà khơng biết đặc tính hàm
truyền đạt của hệ thống. Mơ hình tốn học của bài tốn phân tách thành phần độc lập được trình bày trong nội dung dưới đây.
Giả sử ta quan sát n tổ hợp tuyến tính 𝑥𝑥1, 𝑥𝑥2, …, 𝑥𝑥𝑛𝑛của n thành phần độc 𝑠𝑠1,
𝑠𝑠2, …, 𝑠𝑠𝑛𝑛, chẳng hạn như các tín hiệu thu được từ micro trong một hội thảo. Bỏ tham số thời gian ta cĩ:
𝑥𝑥𝑖𝑖 = 𝑎𝑎𝑖𝑖1𝑠𝑠1 + 𝑎𝑎𝑖𝑖2𝑠𝑠2 + 𝑎𝑎𝑖𝑖3𝑠𝑠3+ … +𝑎𝑎𝑖𝑖𝑛𝑛𝑠𝑠𝑛𝑛
Với 𝑥𝑥𝑖𝑖, 𝑠𝑠1, 𝑠𝑠2, … đều là hàm của tham số thời gian t và𝑎𝑎𝑖𝑖𝑖𝑖, i, j = 1, …, n là các
hệ số thực. Định nghĩa x = (𝑥𝑥1,𝑥𝑥2, … ,𝑥𝑥𝑛𝑛)𝑇𝑇 là véc tơ ngẫu nhiên chứa các phần tử
𝑥𝑥1, 𝑥𝑥2, …, 𝑥𝑥𝑛𝑛 (các tín hiệu thu được/ tín hiệu quan sát được) và s =
(𝑠𝑠1,𝑠𝑠2, … ,𝑠𝑠𝑛𝑛)𝑇𝑇là véc tơ ngẫu nhiên với các phần tử 𝑠𝑠1, 𝑠𝑠2, …, 𝑠𝑠𝑛𝑛(được gọi là tín
hiệu nguồn). Ma trận A gồm các phần tử 𝑎𝑎𝑖𝑖𝑖𝑖 được gọi là ma trận trộn, đặc trưng
cho đặc tính truyền đạt của kênh truyền. Tất cả các vectơ đều được viết dưới dạng vectơ cột. Ta cĩ mơ hình trộn:
x=As
Mơ hình trên được gọi là mơ hình ICA. Mơ hình ICA là một mơ hình sinh (generative model) mơ tả quá trình dữ liệu quan sát được tạo ra bởi một quá trình
tổ hợp các phần tử độc lập 𝑠𝑠𝑖𝑖. Chúng ta chỉ quan sát được véc tơ ngẫu nhiên x,cần
phải ước lượng cả ma trận trộn Avà các thành phần độc lập sbằng việc phân tích
các vectơ ngẫu nhiên x.
Mơ hình ICA giải bài tốn x=Asbằng phương pháp thống kê thơng qua việc
ước lượng vectơ y = Wx (đặt W = 𝐴𝐴−1), W gọi là ma trận tách, y gọi là tín hiệu
khơi phục. Phương pháp ICA dựa trên giả thiết các nguồn tín hiệu gốc là độc lập thống kê với nhau.
Để mơ hình ICA bớt phức tạp và cĩ thể tính được, cần chấp nhận một số giả sử và giới hạn sau:
- Các nguồn tín hiệu là độc lập thống kê
- Các thành phần độc lập là non-Gaussian
- Để đơn giản, ta giả sử ma trận trộn là ma trận vuơng (số nguồn tín hiệu độc
lập bằng số tín hiệu quan sát được)
Để đo lường tính độc lập giữa các tín hiệu khơi phục 𝑦𝑦𝑖𝑖 cĩ thể sử dụng các
phương pháp khác nhau: sử dụng tính non-Gauss, sử dụng thơng tin hỗ tương
(mutual information), sử dụng tính phi tương quan phi tuyến (nonlinear decorrelation).
26 Trước khi áp dụng thuật tốn ICA cần thực hiện một số bước tiền xử lý:
- Quy tâm (Centering):
Tín hiệu thực tế thu được luơn cĩ thành phần nhiễu n, đa số là nhiễu trắng cĩ phân bố Gauss:
x=∑𝑛𝑛
𝑖𝑖=1 𝑎𝑎𝑖𝑖𝑠𝑠𝑖𝑖 + n
Quy tâm là một cách loại bỏ nhiễu trắng cũng như giúp bài tốn trở nên đơn
giản hơn. Quy tâm được thực hiện bằng cách lấy tín hiệu thu được trừđi trị trung
bình của vector dữ liệu E{𝑥𝑥}:
𝑥𝑥′= x - E{𝑥𝑥}
Tín hiệu 𝑥𝑥′ thu được đã quan tâm, E{x} là trị trung bình của vectơ dữ liệu x.
Vectơ xđược gọi là đã quy tâm khi cĩ trị trung bình bằng khơng.
- Trắng hĩa (Whitening)
Trong thống kê, Whitening transformation là phép biến đổi tuyến tính nhằm biến đổi một vector ngẫu nhiên với ma trận hiệp phương sai biết trước thành một tập biến ngẫu nhiên mới cĩ ma trận hiệp phương sai là ma trận đơn vị. Nĩi cách khác, trắng hĩa biến đổi một tập biến ngẫu nhiên tương quan thành một tập biến ngẫu nhiên mới bất tương quan và cĩ phương sai là một.
ICA cĩ thể được thực hiện dễ dàng hơn khi tín hiệu quan sát được trắng hĩa.
Một vector ngẫu nhiên z = (𝑧𝑧1,𝑧𝑧2, … ,𝑧𝑧𝑛𝑛) gọi là được trắng hĩa nếu các vectơ phần
tử 𝑧𝑧𝑖𝑖 khơng tương quan nhau và cĩ phương sai đơn vị:
E{𝑧𝑧𝑧𝑧𝑇𝑇} = I
Quá trình trắng hĩa là phép biến đổi tuyến tính:
z = V𝑥𝑥′
Trong đĩ, 𝑥𝑥′ là dữ liệu cần trắng hĩa, V là ma trận trắng hĩa, z là dữ liệu đã
trắng hĩa. Sau khi quy tâm, 𝑥𝑥′cĩ trị trung bình bằng 0.
Gọi D là ma trận đường chéo của các trị riêng, E là ma trận trực giao các vectơ riêng, V là ma trận làm trắng được tính thơng qua triển khai trị riêng EVD (Eigenvalue Decomposition) của ma trận hiệp phương sai:
D = diag (𝑑𝑑1, 𝑑𝑑2, …, 𝑑𝑑𝑛𝑛)
𝑅𝑅𝑥𝑥′𝑥𝑥′ = E{𝑥𝑥′(𝑥𝑥′)𝑇𝑇} = ED𝐸𝐸𝑇𝑇
V = 𝑅𝑅𝑥𝑥′𝑥𝑥′−
1
2𝐸𝐸𝑇𝑇 = 𝐷𝐷−12𝐸𝐸𝑇𝑇
Đặt 𝐴𝐴̃=VA, suy ra z = Vx = VAs = 𝐴𝐴̃s. Cĩ:
E{𝑧𝑧𝑧𝑧𝑇𝑇} = I
27
⬄ E{𝐴𝐴̃s𝑠𝑠𝑇𝑇𝐴𝐴̃𝑇𝑇} = I
⬄𝐴𝐴̃E{ s𝑠𝑠𝑇𝑇 }𝐴𝐴̃𝑇𝑇 = I
⬄𝐴𝐴̃𝐴𝐴̃𝑇𝑇 = I
Như vậy, 𝐴𝐴̃là một ma trận trực giao.
Trắng hĩa khơng thể là lời giải cho bài tốn ICA mặc dù độ trắng (hay độ bất
tương quan) liên quan đến tính độc lập. Các biến ngẫu nhiên độc lập thì bất tương
quan nhưng điều ngược lại khơng đúng. Tuy vậy, trắng hĩa giúp làm giảm số lượng
tham số cần phải ước lượng. Thay vì phải ước lượngma trận gốc A gồm 𝑛𝑛2 tham
số, ta chỉ cầnước lượng 𝑛𝑛(𝑛𝑛−12 ) tham số của ma trận 𝐴𝐴̃ (ma trận trực giao chỉ cĩ
𝑛𝑛(𝑛𝑛−1)
2 bậc tự do).