CHƯƠNG 1 CƠ SỞ LÝ THUYẾT VỀ ĐIỆN NÃO ĐỒ
3.1 Tiền xử lý tín hiệu điện não bằng phương pháp ICA
Tín hiệu điện não cần được tiền xử lý trước khi tiến hành trích chọn đặc trưng và đưa vào mơ hình phân loại đểdư đốn tín hiệu điện não của bệnh nhân
Tín hiệu điện não thơ Tiền xử lý và trích chọn đặc trưng Kết quả phân loại: Accura cy, F1 score So sánh, đánh giá (n bộ phân loại) Lựa chọn bộ phân loại tốt nhất Bộ phân loại (học máy) Tín hiệu điện não thơ Tiền xử lý và trích chọn đặc trưng Kết quả phân loại: Accura cy, F1 score Bộ phân loại (học máy) . . .
35 tâm thần phân liệt. Việc tiền xử lý nhằm tách tín hiệu cĩ ích (EEG) ra khỏi các tín hiệu gây nhiễu khác (nhiễu trắng, tín hiệu điện tim, tín hiệu điện mắt, tín hiệu điện cơ, …). Việc tách các tín hiệu này khơng thể sử dụng các bộ lọc số, do các tín hiệu trên cĩ phổ tần trùng nhau. Vì thế cần sử dụng các phương pháp thống kê nhằm tách các nguồn tín hiệu ban đầu ra khỏi nhau.
Khi tín hiệu quan sát được là tổng các nguồn tín hiệu ở các khoảng tần số khác nhau, bằng việc sử dụng các bộ lọc số ta cĩ thể tách các nguồn ban đầu riêng biệt. Tuy nhiên, với các tín hiệu là tổng hợp của nhiều nguồn cĩ phổ tần trùng nhau, việc tách các nguồn tín hiệu ban đầu gặp nhiều khĩ khăn. Khi đĩ phân tách các nguồn tín hiệu dựa trên phương pháp thống kê như phân tích thành phần độc lập cho thấy kết quảphân tách đạt hiệu quả.
Tín hiệu điện não thu được cĩ đặc điểm là phổ tần trùng với một số tín hiệu nội sinh khác như tín hiệu điện mắt, tín hiệu điện tim, tín hiệu điện cơ. Vì thế, khơng thể áp dụng các bộ lọc số để loại bỏ các tín hiệu gây nhiễu. Việc áp dụng phương pháp phân tích thành phần độc lập để loại bỏ các tín hiệu nhiễu trên là cần thiết.
Hình 3-4 Phổ tần các tín hiệu y sinh
ICA là thuật tốn giúp phân tách tín hiệu đa biến (multivariate signal) thành các thành phần con dựa trên giả sử độc lập thống kê lẫn nhau của các nguồn tín hiệu non-Gausse. Phân tích thành phần độc lập (ICA) của một vectơ
36 ngẫu nhiên là quá trình làm giảm thiểu sự phụ thuộc thống kê giữa các thành phần của nĩ.
Phân tích thành phần độc lập được sử dụng cho mục đich đánh giá các nguồn tín hiệu ban đầu chỉ thơng qua các tín hiệu thu được mà khơng biết đặc tính hàm truyền đạt của hệ thống. Mơ hình tốn học của bài tốn phân tách thành phần độc lập như sau:
Giả sử ta quan sát n tổ hợp tuyến tính 𝑥𝑥1, 𝑥𝑥2, …, 𝑥𝑥𝑛𝑛 của n thành phần độc 𝑠𝑠1, 𝑠𝑠2, …, 𝑠𝑠𝑛𝑛, chẳng hạn như các tín hiệu thu được từ micro trong một hội thảo. Bỏ tham số thời gian ta cĩ:
𝒙𝒙𝒊𝒊 = 𝒂𝒂𝒊𝒊𝒊𝒊𝒔𝒔𝒊𝒊 + 𝒂𝒂𝒊𝒊𝒊𝒊𝒔𝒔𝒊𝒊 + 𝒂𝒂𝒊𝒊𝒊𝒊𝒔𝒔𝒊𝒊+ … +𝒂𝒂𝒊𝒊𝒊𝒊𝒔𝒔𝒊𝒊
Với 𝑥𝑥𝑖𝑖, 𝑠𝑠1, 𝑠𝑠2, … đều là hàm của tham số thời gian t và𝑎𝑎𝑖𝑖𝑖𝑖, i, j = 1, …, n là các hệ số thực. Định nghĩa x = (𝑥𝑥1,𝑥𝑥2, … ,𝑥𝑥𝑛𝑛)𝑻𝑻 là véc tơ ngẫu nhiên chứa các phần tử 𝑥𝑥1, 𝑥𝑥2, …, 𝑥𝑥𝑛𝑛 (các tín hiệu thu được/ tín hiệu quan sát được) và s =
(𝑠𝑠1,𝑠𝑠2, … ,𝑠𝑠𝑛𝑛)𝑻𝑻là véc tơ ngẫu nhiên với các phần tử𝑠𝑠1, 𝑠𝑠2, …, 𝑠𝑠𝑛𝑛(được gọi là tín hiệu nguồn). Ma trận A gồm các phần tử𝑎𝑎𝑖𝑖𝑖𝑖 được gọi là ma trận trộn, đặc trưng cho đặc tính truyền đạt của kênh truyền. Tất cả các véc tơ đều được viết dưới dạng véc tơ cột. Ta cĩ mơ hình trộn:
x = As
Mơ hình trên được gọi là mơ hình ICA. Mơ hình ICA là một mơ hình sinh (generative model) mơ tả quá trình dữ liệu quan sát được tạo ra bởi một quá trình tổ hợp các phần tử độc lập 𝑠𝑠𝑖𝑖. Chúng ta chỉ quan sát được véc tơ ngẫu nhiên x,
cần phải ước lượng cả ma trận trộn A và các thành phần độc lập s bằng việc phân tích các véc tơ ngẫu nhiên x.
Mơ hình ICA giải bài tốn x = As bằng phương pháp thống kê thơng qua việc ước lượng vectơ y = Wx(đặt W = 𝐴𝐴−1), W gọi là ma trận tách, y gọi là tín hiệu khơi phục. Phương pháp ICA dựa trên giả thiết các nguồn tín hiệu gốc là độc lập thống kê với nhau.
Để mơ hình ICA bớt phức tạp và cĩ thể tính được, cần chấp nhận một số giả sử và giới han sau:
37 - Các thành phần độc lập là non-Gaussian
- Đểđơn giản, ta giả sử ma trận trộn là ma trận vuơng (số nguồn tín hiệu độc lập bằng số tín hiệu quan sát được)
Để đo lường tính độc lập giữa các tín hiệu khơi phục 𝒚𝒚𝒊𝒊 cĩ thể sử dụng các phương pháp khác nhau: sử dụng tính non-Gauss, sử dụng thơng tin hỗtương (mutual information), sử dụng tính phi tương quan phi tuyến (nonlinear decorrelation).
Trước khi áp dụng thuật tốn ICA cần thực hiện một sốbước tiền xử lý: - Quy tâm (Centering):
Tín hiệu thực tếthu được luơn cĩ thành phần nhiễu n, đa số là nhiễu trắng cĩ phân bố Gauss:
𝒙𝒙 = � 𝒂𝒂𝒊𝒊 𝒊𝒊
𝒊𝒊=𝒊𝒊
𝒔𝒔𝒊𝒊+𝒊𝒊
Quy tâm là một cách loại bỏ nhiễu trắng cũng như giúp bài tốn trở nên đơn giản hơn. Quy tâm được thực hiện bằng cách lấy tín hiệu thu được trừđi trị trung bình của vector dữ liệu E{𝑥𝑥}:
𝒙𝒙′= x - E{𝒙𝒙}
Tín hiệu 𝑥𝑥′ thu được đã qui tâm, E{x} là trị trung bình của vectơ dữ liệu x. Vectơ xđược gọi là đã quy tâm khi cĩ trị trung bình bằng khơng.
- Trắng hĩa (Whitening)
Trong thống kê, Whitening transformation là phép biến đổi tuyến tính nhằm biến đổi một vector ngẫu nhiên với ma trận hiệp phương sai biết trước thành một tập biến ngẫu nhiên mới cĩ ma trận hiệp phương sai là ma trận đơn vị. Nĩi cách khác, trắng hĩa biến đổi một tập biến ngẫu nhiên tương quan thành một tập biến ngẫu nhiên mới bất tương quan và cĩ phương sai là một.
ICA cĩ thể được thực hiện dễ dàng hơn khi tín hiệu quan sát được trắng hĩa. Một vector ngẫu nhiên z = (𝑧𝑧1,𝑧𝑧2, … ,𝑧𝑧𝑛𝑛) gọi là được trắng hĩa nếu các vector phần tử𝑧𝑧𝑖𝑖 khơng tương quan nhau và cĩ phương sai đơn vị:
E{𝒛𝒛𝒛𝒛𝑻𝑻} = I
38
z = V𝒙𝒙′
Trong đĩ, 𝑥𝑥′ là dữ liệu cần trắng hĩa, V là ma trận trắng hĩa, z là dữ liệu đã trắng hĩa. Sau khi quy tâm, 𝑥𝑥′cĩ trị trung bình bằng 0.
Gọi D là ma trận đường chéo của các trị riêng, E là ma trận trực giao các vectơ riêng, V là ma trận làm trắng được tính thơng qua triển khai trị riêng EVD (Eigenvalue Decomposition) của ma trận hiệp phương sai:
D = diag (𝒅𝒅𝒊𝒊, 𝒅𝒅𝒊𝒊, …, 𝒅𝒅𝒊𝒊)
𝑹𝑹𝒙𝒙′𝒙𝒙′ = E{𝒙𝒙′(𝒙𝒙′)𝑻𝑻} = ED𝑬𝑬𝑻𝑻
V = 𝑹𝑹𝒙𝒙′𝒙𝒙′−
𝒊𝒊
𝒊𝒊𝑬𝑬𝑻𝑻 = 𝑫𝑫−𝒊𝒊𝒊𝒊𝑬𝑬𝑻𝑻
Đặt 𝐴𝐴̃=VA, suy ra z = Vx = VAs = 𝐴𝐴̃s. Cĩ:
E{𝒛𝒛𝒛𝒛𝑻𝑻} = I
𝑨𝑨�𝑨𝑨�𝑻𝑻 = I
Như vậy, 𝐴𝐴̃ là một ma trận trực giao.
Trắng hĩa khơng thể là lời giải cho bài tốn ICA mặc dù độ trắng (hay độ bất tương quan) liên quan đến tính độc lập. Các biến ngẫu nhiên độc lập thì bất tương quan nhưng điều ngược lại khơng đúng. Tuy vậy, trắng hĩa giúp làm giảm số lượng tham số cần phải ước lượng. Thay vì phải ước lượng ma trận gốc A gồm 𝑛𝑛2 tham số, ta chỉ cần ước lượng 𝑛𝑛(𝑛𝑛−1)
2 tham số của ma trận 𝐴𝐴̃ (ma trận trực giao chỉ cĩ 𝑛𝑛(𝑛𝑛−1)
2 bậc tự do).