Báo cáo toàn văn Kỷ yếu hội nghị khoa học lần IX Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM VIII-O-5 TÁCH VÀ LOẠI BỎ NHIỄU CHO TÍN HIỆU ĐIỆN TÂM ĐỒ ECG SỬ DỤNG PHƯƠNG PHÁP PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP FASTICA CẢI TIẾN Nguyễn Ngọc Hùng, Bùi Trọng Tú, Hồ Anh Vũ, Dương Văn Tuấn Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM Email: hoanhvu2511@gmail.com, {nnhung, bttu}@fetel.hcmus.edu.vn TÓM TẮT Ngày nay, phương pháp phân tích thành phần độc lập ICA (Independent Component Analysis) sử dụng phổ biến, đặc biệt xử lý tín hiệu y sinh đòi hỏi độ xác lẫn tốc độ xử lý cao Bởi tín hiệu y sinh thực tế có biên độ thấp, dễ ảnh hưởng nhiễu tượng chồng lẫn tín hiệu mà áp dụng phương pháp lọc truyền thống thông thường để xử lý Trong báo này, đề xuất phương pháp FastICA sử dụng thuật toán cải tiến số vòng lặp phát triển từ phương pháp lặp Newton’s cổ điển để tăng tốc độ hội tụ giảm phức tạp trình tính toán Với mục tiêu trên, tiến hành mô thực nghiệm tách loại bỏ nhiễu cho tín hiệu điện tâm đồ ECG nhiều trường hợp khác Kết đạt tín hiệu ECG khôi phục hoàn toàn Thuật toán đánh giá tốt thông qua giá trị sai số bình phương trung bình MSE (Mean Square Error) hệ số đánh giá (E) Từ khóa: ICA, FASTICA, ECG, Deflation, Symmetric GIỚI THIỆU Tín hiệu điên tâm đồ ECG tín hiệu y sinh nghiên cứu rộng rãi sử dụng cho việc chẩn đoán bệnh ECG quan tâm đến thiết bị lẫn trình đo gặp nhiều vấn đề, tín hiệu ECG thu dễ bị ảnh hưởng nhiều loại nhiễu khác chồng lẫn trình đo thu thập liệu Nhiễu kể đến: nhiễu ảnh hưởng cử động người bệnh, nhiễu nguồn điện, môi trường, sai số tính toán, nhiễu từ thiết bị điện tử trình thu nhận liệu Bài báo trình bày sau: sở lý thuyết thuật toán ICA trình bày chi tiết phần II Phần III trình bày thuật toán FastICA mô hình ứng dụng thực tế, qua đề xuất cải tiến thuật toán FastICA qua phương pháp lặp Newton’s cổ điển phần IV Phần V trình bày kết mô thực nghiệm thảo luận Cuối kết luận đánh giá kết PHƯƠNG PHÁP ICA Để định nghĩa ICA, sử dụng mô hình biến ẩn thống kê Chúng ta quan sát n biến ngẫu nhiên x1,… , xn, tổ hợp tuyến tính n biến ngẫu nhiên s1,… , sn dạng: xi = ai1s1 + ai2s2 + …+ ainsn, i = 1, 2, …, n (1) Trong aij (i, j = 1, …, n) hệ số thực Theo định nghĩa, si độc lập thống kê với Như vậy, mô hình ICA giải toán x As với điều kiện ràng buộc sau: Các nguồn tín hiệu gốc ban đầu xem độc lập thống kê với Ma trận trộn A ma trận vuông (tín hiệu nguồn si tín hiệu trộn xi nhau) khả nghịch Tối đa có nguồn tín hiệu gốc có phân bố Gauss Phương pháp ICA giải toán x As tìm nghiệm s = A-1x, thực tế tìm s cách trực tiếp được, phải sử dụng thống kê thông qua phép biến đổi tuyến tính y = Wx (đặt W = A-1), y tương ứng s Vector y ước lượng thông qua phép đo tính phi Gauss dựa sử dụng hàm phi tuyến phương pháp xấp xỉ Negentropy Thuật toán FastICA sử dụng tính phi Gaussian để đo tính độc lập hỗ tương Thuật toán đề xuất gồm bước chính: Qui tâm (Centering) Trắng hóa (Whitening) Xấp xỉ hoá Negentropy ISBN: 978-604-82-1375-6 37 Báo cáo toàn văn Kỷ yếu hội nghị khoa học lần IX Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM Qui tâm m x si n (2) i 1 Vector x gọi qui tâm có trị trung bình Bởi tín hiệu thực tế thu có thành phần n xem thành phần nhiễu, đa số nhiễu trắng có phân bố Gauss, qui tâm xem cách loại bỏ nhiễu trắng giúp toán trở nên đơn giản (3) xnew x E{x} Tín hiệu xnew thu qui tâm, E{x}là trị trung bình vector liệu x Trắng hóa Trắng hóa vector x dựa tính phi tương quan hay ma trận hiệp phương sai thân x ma trận đơn vị dựa vector x qui tâm (có trị trung bình không) Trắng hóa phép biến đổi ma trận trộn A trở nên trực giao dựa thực phép nhân ma trận V với vector liệu x (4) z Vx Với V ma trận làm trắng tính thông qua triển khai trị riêng EVD (Eigenvalue Decomposition) ma trận hiệp phương sai (5) E{xxT } EDET Trong E ma trận trực giao vector trị riêng E{xxT} = EDET, D ma trận đường chéo trị riêng D = diag(d1, …, dn) Lúc này, làm trắng hóa thực ma trận làm trắng Như vậy, ~ A VA trực giao, trắng hóa xem nửa phương pháp ICA dựa xấp xỉ ma trận W không gian trực giao Xấp xỉ Negentropy Negentropy J định nghĩa sau: J ( y) H ( ygauss ) H ( y) (6) Trong ygauss biến ngẫu nhiên Gauss ma trận tương quan y Do tính chất đề cập bên trên, Negentropy không âm Nó y có phân bố Gauss Ước lượng Negentropy khó, thực tế Negentropy xấp xỉ dựa hàm đối tượng Gi p (7) J ( y ) [ E{Gi ( y )} E{Gi (v)}]2 i 1 Các hàm Gi chọn tăng không nhanh, sau số hàm chứng minh hữu hiệu: G1 log cosh(a1u ) a1 u2 G2 exp 2 G3 y4 (8) (9) (10) THUẬT TOÁN FASTICA Thuật toán FastICA dựa phép lặp điểm cố định (fix-point) cho tốc độ hội tụ nhanh so với ICA truyền thống dựa phương pháp lặp Newton’s cổ điển.Với hai phương pháp trực giao (Deflationary orthonormalization) viết tắt Deflation trực giao đối xứng (Symmetrical orthonormalization) viết tắt Symmetric việc giải toán trở nên nhanh chóng Trực giao (Deflation) Một cách trực giao đơn giản thực trực giao vector theo phương pháp Gram-Schmidt [1 – 2], có nghĩa ước lượng thành phần độc lập Giả sử ước lượng p thành phần độc lập, p vectơ w1, …, wn thực giải thuật tìm thành phần cho wp+1 Tuy nhiên sau bước lặp cần trừ lượng (wTp1w j )w j , j 1,, p chuẩn hóa cho wp+1 với g đạo hàm Gi Cụ thể bước làm lưu đồ thuật toán hình (lưu ý: ICs số thành phần độc lập) ISBN: 978-604-82-1375-6 38 Báo cáo toàn văn Kỷ yếu hội nghị khoa học lần IX Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM Dữ liệu Qui tâm Khởi tạo vecto wp, với ||wp|| = Trắng hóa p1 wp w p w p ( wTp wi ) wi , w p | | wp | | i 1 w p E{zg( wTp z )} E{g ( wTp z )}w p Sai Đúng Hội tụ Convergence Kết Hình Lưu đồ thuật toán FastICA sử dụng trực giao Trực giao đối xứng (Symmetric) Phương pháp trực giao có hạn chế sai số ước lượng vectơ đầu tích lũy vectơ kế tiếp, phương pháp trực giao đối xứng dường hữu hiệu Phương pháp xem tất vectơ tương đương nhau, không ưu tiên cho thành phần nào, có nghĩa vectơ wi không ước lượng riêng biệt đối một, mà chúng ước lượng lần song song Các bước thực hình 2: Dữ liệu Qui tâm Khởi tạo vector wi, với ||wi|| = 1, i = 1,…, m Trắng hóa W W (W WT ) 1/ 2W , W wi E{zg(wiT z)} E{g (wiT z)}wi ||W || Sai Hội tụ Convergence Đúng Kết Hình Lưu đồ thuật toán FastICA sử dụng trực giao đối xứng CẢI TIẾN THUẬT TOÁN Phương pháp lặp Newton’s cổ điển có tốc độ hội tụ bậc hai Bắt đầu từ dự đoán x0, sử dụng phương trình tiếp tuyến x0 để xấp xỉ giá trị x1 , xn (11) xn 1 xn f ( xn ) f / ( xn ) (11) Thuật toán FastICA yêu cầu tốc độ hội tụ nhanh để đảm bảo yêu cầu đặt [3], báo đề xuất sử dụng phương pháp Newton’s cải tiến có tốc độ hội tụ bậc tám phát triển từ phương pháp Newton’s có tốc độ bậc sáu [4] Cụ thể sau: f ( zn ) f / ( xn ) f '( yn ) x z n1 n f / ( x ) f / ( y ) f / ( x ) n n n ISBN: 978-604-82-1375-6 (12) 39 Báo cáo toàn văn Kỷ yếu hội nghị khoa học lần IX Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM f ( xn ) f ( xn ) z x y x n [ f / ( x ) f / ( y )] n n f / (x ) , n n n n (13) Phương pháp Newton’s cải tiến (16) với tốc độ hội tụ bậc tám [5]: un 1 f (x ) f ( xn ) f xn / n f ( xn ) xn f / ( xn ) 1 un 1 x n 1 v n 1 f (un 1) f (x ) f / xn / n f ( xn ) f (vn 1) f '( 1) (14) (15) (16) Phương pháp FastICA sử dụng hàm xấp xỉ Negentropy Gi dựa phương pháp Newton’s Ước lượng vector w theo phương pháp Newton’s cổ điển (17), phương pháp Newton’s cải tiến (18), E{wT xg ( wT x)} w w [ E{zg ( wT z )} w] [ E{g / ( wT z )} ] (17) w w [ E{zg ( wvT z )} wv ] [ E{g / ( wTu z )} ] (18) Hay: w E{zg (wvT z )} E{g / (wuT z )}wv (19) wv E{zg (wuT z)} E{g / (wTy z)}wu (20) wu E{zg (wT z)} E{g (wTy z)} E{g (wT z)}w wy (21) wy E{zg (wT z)} E{g / (wT z)}w (22) Trong đó: Thuật toán FastICA sử dụng phương pháp Newton’s cải tiến tóm gọn qua bước sau: T Bước 1: Gán n ← 0, khởi tạo vectơ w0 (ngẫu nhiên) ban đầu với chuẩn đơn vị, gán E{wT xg(w0 x)} Bước 2: Gán wn1 E{zg(wvT z)} E{g (wuT z)}wv Bước 3: Chuẩn hóa vector wn+1 ← wn+1/||wn+1|| T Nếu thuật toán không hội tụ, gán E{wT n ← n+1, quay lại bước n1 xg ( wn1 x)} MÔ PHỎNG VÀ KIỂM TRA Đánh giá Để đảm bảo điều kiện thuật toán ICA, tiến hành thực nghiệm liệu ECG, giả lập ma trận lai trộn A để tiện cho viêc đánh giá chất lượng phân tách loại bỏ nhiễu thông qua giá trị MSE hệ số đánh giá E [3 – 4] ISBN: 978-604-82-1375-6 40 Báo cáo toàn văn Kỷ yếu hội nghị khoa học lần IX Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM Hệ số đánh giá Chất lượng thuật toán qua sai số hai ma trận lai giải lai trộn với P = WA đánh giá dựa hệ số đánh giá E n n n n pij p ji E 1 1 j 1 i 1 max j p ji i 1 j 1 max i pij (23) Kết đánh giá chất lượng thuật toán FastICA phân tách tín hiệu dựa bảng tham khảo Kết phân tách đạt tốt E = 0, nhiên thực tế E tiến đến không Bảng Bảng tham khảo hệ số đánh giá Đánh giá Tốt E ≤0.2247 Trung bình Kém ≥3.5344 1.3773 Mean Square Error Ngoài đánh giá chất lượng thuật toán qua hệ số đánh giá sử dụng thêm sai số bình phương trung bình nhằm kiểm tra sai số cho thuật toán để đảm bảo đặc trưng tín hiệu MSE m yij sij m i 1 (24) Một điểm không xác định ICA không xác định vị trí thành phần độc lập, dùng MSE thông thường, phải cần “minimum” tập hợp hi tìm được: 1 m hi yij sij m i 1 MSEnew (25) h1 h 2 hn (26) Trong đó: n số thành phần độc lập, m số mẫu Kết mô Thực nghiệm Chúng sử dụng tín hiệu ECG thực tế [8] với số mẫu m = 10000, tín hiệu ECG thường có tần số thấp (50 – 60 Hz) Cùng với nhiễu AC, mô thêm nhiễu (có tần số từ 25 đến 35 Hz) có tỷ số Tín hiệu /Tạp âm SNR = 5dB Kết chi tiết thể bảng Các tín hiệu biễu diễn qua hình Bảng Kết phương pháp trực giao FastICA Cơ Cải tiến ISBN: 978-604-82-1375-6 ICs Lần lặp MSE 2.4116x10-5 2 7.3921x10-5 1.0258x10-4 2.4415x10-5 2 5.4808x10-4 5.8138x10-4 E 6.5945x10-2 4.3333x10-2 41 Báo cáo toàn văn Kỷ yếu hội nghị khoa học lần IX Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM Bảng Kết phương pháp trực giao đối xứng FastICA Cơ Cải tiến ICs Lần lặp MSE E -5 2.4159x10 8.1306x10-5 1.1007x10-4 2.4508x10-5 2 5.5062x10-4 5.8406x10-4 4.4352x10-2 2.2160x10-2 s1 s2 s3 Hình Tín hiệu nguồn trước trộn x1 x2 x3 Hình Tín hiệu trộn thu y1 y2 y3 Hình Tín hiệu thu sau tách dùng FastICA Nhận xét: Kết phân tách tín hiệu ECG có nhiễu AC nhiễu Gauss 5dB thể hình Kết đánh giá tốt thông qua giá trị MSE hệ số đánh giá E Kết từ hai phương pháp trực giao bảng cho thấy phương pháp trực giao đối xứng có số lần lặp nhanh (chẳng hạn xét ICs = 3, phương pháp FastICA sử dụng trực giao Newton’s cổ điển cho kết số lần lặp trực giao đối xứng cho kết 2), hay thời gian tính toán nhanh kết không thay ISBN: 978-604-82-1375-6 42 Báo cáo toàn văn Kỷ yếu hội nghị khoa học lần IX Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM đổi Tương tự thuật toán FastICA sử dụng phương pháp Newton’s cải tiến cho tốc độ hội tụ nhanh hơn, có nhiều bước tính toán Thực nghiệm Tùy vào cử động (chẳng hạn cử động mắt trái, mắt phải, ngón tay, hay bàn tay, bàn chân) mà kết đo tín hiệu ECG khác nhau, trường hợp sử dụng tín hiệu ECG thực tế tiến hành đo người cử động khác Trường hợp sử dụng tín hiệu ECG đo ba lần, đồng thời mô tín hiệu có nhiễu AC, nhiễu nhiễu bất kỳ (chẳng hạn nhiễu có dạng hình sin, hình cưa, hình tam giác, hình vuông) để chứng minh tính khả thi thuật toán dựa việc đo tính phi Gauss hay độc lập thống kê tín hiệu qua xấp xỉ Negentropy với hàm ước lượng G i Các tín hiệu tách thể hình Bảng Kết phương pháp trực giao FastICA Cơ ICs Lần lặp MSE 6.5611x10-3 1.3898x10-2 4.7287x10-3 7.7317x10-4 5 1.0130x10-2 1.6335x10-3 8.7930x10-3 2 9.9149x10-3 3 3.1204x10-3 4 5.7479x10-4 9.8716x10-3 2.0404x10-3 Cải tiến E 1.4319x10-3 2.3384x10-3 Bảng Kết phương pháp trực giao đối xứng FastICA Cơ ICs Lần lặp MSE 8.2131x10-5 1.0177x10-3 3 9.9190x10-3 4 1.0942x10-2 4.2473x10-4 1.7100x10-3 7.1094x10-5 2 9.9101x10-4 3 1.3601x10-2 4 6.2811x10-4 6.8388x10-3 2.0679x10-3 Cải tiến ISBN: 978-604-82-1375-6 E 9.5417x10-3 7.5602x10-3 43 Báo cáo toàn văn Kỷ yếu hội nghị khoa học lần IX Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM s1 s2 s3 s4 s5 s6 Hình Tín hiệu nguồn trước trộn x1 x2 x3 x4 x5 x6 Hình Tín hiệu trộn thu y1 y2 y3 y4 y5 y6 Hình Tín hiệu thu sau tách dùng FastICA Nhận xét: Kết phân tách tín hiệu ECG có nhiễu đạt kết tốt thể thông qua giá trị MSE hệ số đánh giá E bảng Kết cho thấy thuật toán FastICA sử dụng phương pháp trực giao đối xứng hiệu trực giao hầu hết trường hợp Tuy nhiên tính toán phương pháp phức tạp tốn nhiều thời gian ISBN: 978-604-82-1375-6 44 Báo cáo toàn văn Kỷ yếu hội nghị khoa học lần IX Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM KẾT LUẬN Trong báo, đưa phương pháp sử dụng FastICA để tách hỗn hợp loại bỏ nhiễu tín hiệu điện tâm đồ Và đề xuất phương pháp Newton’s cải tiến để giảm số vòng lặp, tiết kiệm thời gian tài nguyên tính toán Với ưu điểm FastICA việc tách loại bỏ nhiễu AC, nhiễu đạt kết tốt tỷ số Tín hiệu/Tạp âm (SNR) thấp Ở hai trường hợp mô đưa để minh họa cho tính hiệu phương pháp đề xuất Hướng phát triển tiếp theo, nghiên cứu thêm mức độ phức tạp thuật toán, khả thực thi thuật toán FastICA phần cứng FPGA Sau giải toán ICA tối ưu phần cứng để tăng khả ứng dụng thực tiễn SEPARATING AND REMOVING NOISES FOR ECG SIGNAL USING IMPROVED FASTICA ALGORITHM ABSTRACT Nowadays, Independent Component Analysis (ICA) algorithm is used very popular in feature extraction of signals, especially in biomedical signal processing requiring high precision and processing speed Because amplitude of biomedical signals is usually low, they are very easy affected by noises and artifacts in signal acquisition process Moreover, these signals often overlap each other making them difficult for analyzing and processing with conventional filters In this paper, FastICA algorithm is used to separate and remove noises for Electrocardiogram (ECG) signal An improvement in iteration numbers of FastICA optimally based on Newton’s iterative method is proposed to accelerate convergence, reduce time and complexity in calculation process of FastICA algorithm The proposed algorithm is verified by the experimental simulation results in separating and removing noises and artifacts for ECG signal Efficiency and accuracy of algorithm are evaluated through mean square error (MSE) value and algorithm evaluation coefficient (E) of signals Key words: ICA, FASTICA, ECG, Deflation, Symmetric TÀI LIỆU THAM KHẢO [1] Ricky Der, “Blind Signal Separation”, Department of Electrical & Computer Engineering, McGill University, 2001 [2] S Weerakoon and T G I Fernando, “A variant of Newton’s method with accelerated 3rd order convergence”, Applied Mathematics Letter 2, Vol 13, Issue 8, pp 87-93, 2000 [3] Feng Zhao and Min Cai, “An Improved Method for the FastICA Algorithm”, IEEE International Conference on Multimedia Technology (ICMT), pp – 4, 2010 [4] K J Kim, S Zhang, and S W Nam, “Improved FastICA algorithm using a sixth-order Newton’s method”, IEICE Electronics Express, Vol 6, No.13, pp.904-909, 2009 [5] Tahir Ahmad, Norma Alias, Mahdi Ghanbari and Mohammad Askaripour, “Improved Fast ICA Algorithm Using Eighth-Order Newton’s Method”, Research Journal of Applied Sciences, Engineering and Technology, pp 1794-1798, 2013 [6] S.Amari, A Cichoki, and H H Yang, “A new learning algorithm for Blind Signal Separation”, Advances In Neural Information Processing Systems, MIT Press, Cambridge MA, pp 757-763, 1996 [7] Mrinal Phegade, P Mukherji, “ICA Based ECG Signal Denoising”, The International Conference on Advances in Computing, Communications and Informatics (ICACCI), pp 1675 – 1680, 2013 [8] Chan ADC, Hamdy MM, Badre A, Badee V, “Wavelet Distance Measure for Person Identification using Electrocardiograms”, IEEE Transactions on Instrumentation and Measurement, vol 57, no 2, pp 248253, 2008 ISBN: 978-604-82-1375-6 45