Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 50 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
50
Dung lượng
3,97 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ LÊ HOÀNG ANH PHÁT HIỆN BẤT THƯỜNG BẰNG PHÂN TÍCH TENSOR ĐỂ NHẬN BIẾT XUNG ĐỘNG KINH TRONG DỮ LIỆU ĐIỆN NÃO Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 8480104.01 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN LINH TRUNG Hà Nội – 11/2018 i LỜI CAM ĐOAN Tôi xin cam đoan kết nghiên cứu luận văn riêng chưa cơng bố cơng trình nghiên cứu Hà nội, ngày 15 tháng 11 năm 2018 Học viên Lê Hoàng Anh ii MỤC LỤC LỜI CAM ĐOAN i Danh mục ký hiệu, chữ viết tắt iv Danh mục bảng v Danh mục hình vẽ, đồ thị vi MỞ ĐẦU vii LỜI CẢM ƠN ix CHƯƠNG 1.1 TỔNG QUAN VỀ LUẬN VĂN Bất thường phương pháp phát bất thường phổ biến 1.1.1 Bất thường 1.1.2 Các phương pháp phát bất thường phổ biến 1.2 Phát xung động kinh liệu EEG 1.2.1 Bệnh động kinh xung động kinh 1.2.2 Các phương pháp phát xung động kinh 1.3 Phân tích ten-xơ 1.4 Khái quát nội dung luận văn 10 CHƯƠNG NGHIÊN CỨU CƠ SỞ 12 2.1 Các khái niệm ten-xơ 12 2.2 Thuật tốn phân tích HOSVD 15 2.3 Biến đổi sóng liên tục - CWT 17 CHƯƠNG HỆ THỐNG PHÁT HIỆN XUNG ĐỘNG KINH SỬ DỤNG HOSVD 19 3.1 Biểu diễn liệu EEG 19 iii 3.2 Trích trọn đặc trưng 21 3.3 Phân loại 23 CHƯƠNG KẾT QUẢ THỰC NGHIỆM VÀ KẾT LUẬN 25 4.1 Tập liệu 25 4.2 Đánh giá thuật toán 28 4.3 Kết 30 4.4 Kết luận 36 TÀI LIỆU THAM KHẢO 38 iv Danh mục ký hiệu, chữ viết tắt STT Ký hiệu, viết tắt Tên đầy đủ Giải thích EEG Electroencephalography Điện não đồ CP/PARAFAC Paralel Factor Analysis Phân tích hệ số song song PCA Principal component analysis Phân tích thành phần Tucker Tucker Phân tích Tucker HOSVD Higher-order singular value decomposition Phân tích trị riêng bậc cao CWT Continueous Wavelet Transform Biến đổi sóng liên tục DWT Discrete Wavelet Transform Biến đổi sóng rời rạc SVM Support Vector Machine Máy vec-tơ hỗ trợ KNN K-Nearest Neighbors K láng giềng gần 10 ROC Receiver Operating Charateristic Đường cong ROC 11 TPR True Positive Rate Tỉ lệ phát 12 FPR False Positive Rate Tỉ lệ phát nhầm 13 AUC Area Under the Curve Diện tích nằm đường cong ROC v Danh mục bảng Bảng 4-1 Đánh giá chất lượng mô hình 34 Bảng 4-2 So sánh SVM với KNN 35 Bảng 4-3 So sánh HOSVD với CP 36 vi Danh mục hình vẽ, đồ thị Hình 1.1: Ví dụ điểm bất thường khơng gian hai chiều [2] .2 Hình 1.2 Ví dụ bối cảnh bất thường [2] Hình 1.3 Ví dụ bất thường tập hợp tín hiệu điện tim Hình 1.4 Mơ hình thu thập liệu EEG Hình 1.5 Ví dụ xung động kinh cục [10] Hình 1.6 Ví dụ xung động kinh toàn [5] Hình 1.7 Mơ hình hệ thống phát xung động kinh liệu EEG sử dụng phân tích ten-xơ 10 Hình 2.1 Ten-xơ ba chiều 12 Hình 2.2 Các lát cắt ten-xơ bậc [21] 13 Hình 2.3 Các chế độ ten-xơ bậc ba [21] 13 Hình 2.4.Phân tích SVD 15 Hình 2.5 Phân tích HOSVD cho ten-xơ bậc 16 Hình 2.6 Thuật tốn HOSVD 17 Hình 3.1 Mơ tả hệ thống phát xung động kinh 19 Hình 3.2 Quá trình tạo ten-xơ bậc 20 Hình 3.3 Hàm Mexican hat 21 Hình 3.4 Mơ tả q trình trích chọn đặc trưng 22 Hình 4.1 Tín hiệu EEG số kênh liệu EEG 25 Hình 4.2 Đoạn liệu kiểm thử chứa liệu dẫn tới co giật 26 Hình 4.3 Phân tích Fourier tín hiệu EEG 27 vii MỞ ĐẦU Động kinh loại rối loạn thần kinh, đặc trưng xung động kinh xuất lặp lặp lại nhiều lần Theo nghiên cứu tổ chức WHO vào tháng năm 2018, giới có khoảng 50 triệu người mắc bệnh động kinh, hầu hết người mắc bệnh động kinh nằm nước nghèo phát triển [1], máy móc để phục vụ cho việc chuẩn đoán bệnh lại tốn Trong việc chẩn đoán bệnh động kinh sử dụng liệu điện não (EEG), hệ thống phát xung động kinh tự động xác hữu ích có ý nghĩa, đặc biệt trường hợp việc đọc liệu EEG phát xung động kinh ghi tốn thời gian, cơng sức, tính hiệu lại phụ thuộc vào trình độ bác sĩ chẩn đốn Nhận thức vấn đề này, đặt toán xây dựng hệ thống phát xung động kinh liệu điện não EEG Trong nghiên cứu này, truyền cảm hứng từ thành cơng việc áp dụng phân tích ten-xơ vào ứng dụng thực tế nói chung y học nói riêng, chúng tơi áp dụng phân tích HOSVD, loại phân tích ten-xơ, để nhận biết xung động kinh liệu EEG Cụ thể hơn, trước tiên, biến đổi sóng liên tục (CWT) sử dung để chuyển đổi đoạn liệu điện não đồ EEG hai chiều thành ten-xơ bậc với chiều mặt thời gian, không gian tần số Tiếp theo đó, chúng tơi xếp chồng ten-xơ đại diện cho xung động kinh liệu thành ten-xơ bậc 4, trước phân tích HOSVD để thu ma trận tải thành phần Các ma trận sau sử dụng để xây dựng không gian đặc trưng cho xung động kinh theo phương pháp Cuối cùng, sử dụng hai phân loại quen thuộc học máy gồm SVM KNN để viii nhận biết xung động kinh từ đặc điểm thu từ việc chiếu tenxơ EEG lên không gian đặc trưng vừa huấn luyện Kết thực nghiệm rằng, hệ thống nhận biết xung động kinh sử dụng phân tích HOSVD liệu EEG cho kết phân loại tốt thời điểm xuất xung động kinh thời điểm “bình thường” Đồng thời, so sánh phương pháp đề xuất với phương pháp dựa phân tích ten-xơ khác CP/PARAFAC Kết cho thấy hiệu HOSVD với độ nhạy 99% tốt so với 75% CP ix LỜI CẢM ƠN Tôi xin chân thành cảm ơn hướng dẫn tận tình PGS TS Nguyễn Linh Trung, PGS TS Phan Xuân Hiếu, TS Nguyễn Việt Dũng, ThS Nguyễn Thị Anh Đào, em Lê Trung Thành anh chị em Phòng thí nghiệm Tín hiệu Hệ thống giúp đỡ tơi hồn thành nghiên cứu Tơi cảm ơn gia đình, bạn bè anh em cơng ty ủng hộ tạo điều kiện cho suốt quãng thời gian học tập nghiên cứu Tôi xin bày tỏ lòng biết ơn đến đề tài nghiên cứu khoa học số 102.02-2015.32 quỹ phát triển khoa học công nghệ Quốc gia (National Foundation for Science and Technology Development - NAFOSTED) tài trợ cho hội thực nghiên cứu 26 Hình 4.1 mơ tả tín hiệu EEG kênh khác lấy từ tập liệu Kaggle, với thời điểm từ 25001 đến 50000 có chứa xung động kinh Có thể thấy, việc người bình thường xác định thời điểm xảy xung động kinh khó Bên cạnh đó, hình 4.2 biểu diễn thời xảy xung động kinh khác mà mắt thường dễ dàng nhận EEG (mV) Hình 4.2 Đoạn liệu kiểm thử chứa liệu dẫn tới co giật Trong trình tiền xử lý, nhận thấy rằng, thông thường tần số sóng điện não chia thành dải tần sau [25]: (i) dải delta ( ∈ × với R = [200 đa tuyến ước lượng phần trước Các kết thực 15] hạng ∈ ∈ nghiệm minh họa hình 4.6 đến 4.9 ∈ 33 Từ hình 4.6, ta thấy thành phần đại diện cho số yếu tố định Ví dụ, với ma trận hệ số gốc miền kênh [ > , thành phần #2 tập trung đặc trưng cho kênh từ 12 đến 14, tương tự với thành phần #1, #7, #10 #14 Hình 4.6 Biểu diễn hình ảnh ma trận hệ số gốc [ s Sau đó, chúng tơi sử dụng biến đổi wavelet để tạo thành ten-xơ chiều [20] với 15 kênh ten-xơ bao gồm 1200 mẫu 34 Hình 4.7 Sự khác biệt điểm xung động kinh hoạt động bình thường 4.3.3 Kết phân loại Khi có tập ten-xơ, chúng tơi thực q trình chiếu ten-xơ lên khơng gian gốc, hay gọi ma trận hệ số, theo cơng thức (3.3), sau vec-tơ hóa thành vec-tơ đặc trưng Những vec-tở đặc trưng chia làm hai tập liệu gồm tập huấn luyện kiểm nha tỉ lệ crossvaliation Kết phân loại mô tả thống kê trình bày Bảng 4.1 Bảng cho thấy mơ hình chúng tơi có tỉ lệ bỏ sót thời điểm thấp độ nhạy (SEN) tốt (có trường hợp với tỉ lệ lên đến 100%), độ chuẩn xác trung bình (ACC) 78%, khả dự đốn thời điểm khơng có xung co giật lên tới 72% TH SE/NSE 180/500 180/500 180/500 180/500 180/500 Trung bình TP 176 174 180 178 172 176 TN 400 290 338 374 386 357 SEN 0.98 0.97 1.00 0.99 0.96 0.98 ACC 0.85 0.68 0.76 0.81 0.82 0.78 SPE 0.80 0.58 0.68 0.75 0.77 0.72 AUC 0.93 0.86 0.93 0.96 0.95 0.92 Bảng 4-1 Đánh giá chất lượng mơ hình Bên cạnh đó, sử dụng đồ thị ROC để đánh giá chất lượng mơ hình Với kết AUC lên đến 86% năm trường hợp, đường ROC cho thấy kết tương đồng Trên hình 4.8, đường cong ROC bám sát điểm (0,1) tập liệu cụ thể 35 Hình 4.8 Đồ thị ROC Hơn nữa, chúng tơi so sánh q trình huấn luyện mơ hình SVM với mơ hình KNN Kết cho thấy SVM cho hiệu dự đoán tốt KNN liệu Tuy nhiên, hai phân loại để đưa tỉ lệ phát xung động kinh 98.0% Mơ hình SVM KNN TP 178 176 TN 396 316 SEN 0.99 0.98 ACC 0.84 0.72 SPE 0.79 0.63 AUC 0.93 0.80 Bảng 4-2 So sánh SVM với KNN Cuối cùng, thực so sánh phương pháp mà sử dụng HOSVD với phương pháp phân tích ten-xơ khác CP Kết cho thấy HOSVD hiệu CP việc phân tích ten-xơ bậc cao (như Hình 4.9 Bảng 4-3) 36 Hình 4.9 So sánh đường ROC HOSVD CP Phương pháp HOSVD CP TP 178 134 TN 392 380 SEN 0.99 0.75 ACC 0.84 0.76 SPE 0.79 0.76 AUC 0.93 0.84 Bảng 4-3 So sánh HOSVD với CP 4.4 Kết luận Trong nghiên cứu này, phát thành công xung động kinh sử dụng tiếp cận dựa phân tích ten-xơ Cụ thể, thuật toán HOSVD lần áp dụng toán phát xung động kinh, có khả phân tích đặc điểm liệu EEG nói chung xung động kinh nói riêng Cách tiếp cận kết hợp HOSVD mô hình SVM mang lại kết phát xung động kinh với độ xác cao so với mơ hình KNN phương pháp phân tích ten-xơ khác CP/PARAFAC Bên cạnh đó, khác với nghiên cứu [20], áp dụng thành công phương pháp dựa ten-xơ để xây dựng không gian đặc trưng 37 cho xung động kinh Trong [20], Đào nhóm nghiên cứu xây dựng khơng gian đặc trưng gai động kinh việc xếp chồng trích chọn đặc trưng từ thời điểm có xuất khơng xuất gai động kinh Trong nghiên cứu mình, tơi xây dựng khơng gian đặc trưng xung động kinh cách xếp chồng trích chọn đặc trưng từ ten-xơ đại diện cho thời điểm xuất xung động kinh Ngồi ra, thay sử dụng phương pháp phân tích ten-xơ không âm [20], sử dụng phương pháp phân tích ten-xơ HOSVD để xây dựng khơng gian đặc trưng xung động kinh Trong nghiên cứu mình, chúng tơi sử dụng thực thi thí nghiệm máy tính có cấu hình: Bộ vi xử lý Intel Core i5-6500 nhân, RAM 16GB, đồ họa GeForce GTX 1060 6GB Trong giới hạn phần cứng dùng để nghiên cứu mình, tơi thực mục đích nghiên cứu xây dựng thuật toán phát xung động kinh liệu điện não Các kết mơ cho kết tích cực Thời điểm dự đốn xác, tỉ lệ lỗi nhỏ thời điểm có xung động kinh thời điểm khơng có xung động kinh, từ phần giúp người bệnh có sống tốt hơn, phòng tránh tai nạn đáng tiếc Trong tương lai, tiếp tục nghiên cứu để nâng cao chất lượng phát xung động kinh liệu điện não EEG Cụ thể, việc thay thuật tốn phân tích ten-xơ góp phần cải thiện thời gian tính tốn phân tích Tucker, phân tích Tucker khơng âm, phân tích thành phần Bên cạnh đó, chúng tơi muốn sử dụng mơ hình phân loại cao cấp mơ hình deep learning Đồng thời, trình thu thập phân tích liệu hệ thống khiến ta phải đối mặt với khối lượng liệu lớn mà công cụ phần mềm sở liệu bình thường khơng thể lưu trữ, quản lý phân tích Bên cạnh đó, việc xử lý tín hiệu liên tục EEG cần sử dụng biến đổi wavelet với dải tần khác Chúng đồng thời mong muốn nghiên cứu thêm thuật toán khác để phát nhiều loại bất thường hơn, nhanh xác hơn, đem lại lợi ích nhiều 38 TÀI LIỆU THAM KHẢO (2018) “Epilepsy”, Availabe http://www.who.int/newsroom/fact-sheets/detail/epilepsy B Arindam, C Varun and K Vipin (2009), “Anomaly detection: A survey”, ACM Computing Surveys, 31(3), pp 1-72 M Augusteijn and B Folkert (2002), “Neural network classification and novelty detection”, International Journal on Remote Sensing, 23(14), pp 2891–2902 K Das and J Schneider (2007), “Detecting anomalous records in categorical datasets”, In Proceedings of the 13th ACM SIGKDD international conference on Knowledge discovery and data mining ACM Press M Davy and S Godsill (2002), Detection of abrupt spectral changes using support vector machines An application to audio signal segmentation, In Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing T Ide and H Kashima (2004), Eigenspace-based anomaly detection in computer systems, In Proceedings of the 10th ACM SIGKDD international conference on Knowledge discovery and data mining ACM Press, pp 440–449 M.L Shyu, S.C Chen, K Sarinnapakorn and L Chang (2003), A novel anomaly detection scheme based on principal component classifier, In Proceedings of 3rd IEEE International Conference on Data Mining, pp 353–365 M Ahmed, N Amal and S Osman (2014), “Epileptic seizure detection from EEG signal using discrete wavelet transform and ant colony classifier”, “IEEE ICC”, 14, pp 3529-2534 39 N.T.A Dao, N.L Trung, L.V Nguyen, T.D Tan, N.T.H Anh and B Boashash (2018), “A multistage system for automatic detection of epileptic spikes”, Rev Journal on Electronics and Communications, 8(1-2) 10 K Rahul, “Artifacts in EEG - Recognition and differentiation”, Availabe https://www.slideshare.net/drrahulkumarsingh/artifacts-in-eegrecognition-and-differentiation 11 T.N Alotaiby, S.A Alshebeili, T Alshawi, I Ahmad and F.E.A El-Samie (2014), “EEG seizure detection and prediction algorithms: a survey”, EURASIP Journal on Advances in Signal Processing, 1(183) 12.A Subasi and M.I Gursoy (2010), “EEG signal classification using PCA, ICA, LDA and support vector machines”, Expert Systems with Applications, 37, pp 8659-8666 13.S Raghunathan, A Jaitli and PP Irazoqui (2011), “Multistage seizure detection techniques optimized for low-power hardware platforms”, 14.R.J Oweis and E.W Abdulhay (2011), “Seizure classification in EEG signals utilizing Hilbert-Huang transform”, BioMedical Engineering OnLine, 10 15.F Hadi, G Joao (2016), “Tensor-based anomaly detection: An interdisciplinary survey”, Knowledge-Based Systems (2016), 0, pp 1-28 16.N.D Sidiropoulos, L.D Lathauwer, X Fu, K Huang and E.E Papalexakis (2017), “Tensor decomposition for signal processing and machine learning”, IEEE Transactions on Signal Processing, 65(13), pp 35513582 17.E Acar, C Aykut-Bingol, H Bingol, R Bro and B Yener (2007), “Multiway analysis of epilepsy tensors”, Bioinformatics, 23(13), pp i10i18 40 18 M.D Vos, A Vergult, L.D Lathauwer, W.D Clercq, S.V Huffel, P Dupont, A Palmini and W.V Paesschen (2007), “Canonical decomposition of ictal scalp EEG reliably detects the seizure onset zone”, NeuroImage, 37(3), pp 844-854 19.W Deburchgraeve, P.J Cherian, M.D Vos, R.M Swarte, J.H Blok, G.H Visser, P Govaert and S.V Huffel (2009), “Neonatal seizure localization using PARAFAC decomposition”, Clinical Neurophysiology, 120, pp 1787-1796 20.N.T.A Dao, L.T Thanh, N.L Trung and L.V Ha (2018), “Nonnegative ten-sor decomposition for EEG epileptic spike detection”, 5th NAFOSTED Conference on Information and Computer Science (NICS), IEEE 21.G Kolda and W Brett (2009), “Tensor decompositions and applications”, SIAM Review, 51(3), pp 455-500 22.Mallat, Stephane “A wavelet tour of signal processing: the sparse way” Academic press, 2008 23.M Latka, Z Was, A Kozik and B.J West (2003), “Wavelet analysis of epileptic spikes”, Physical Review E, 67(5) 24.American Epilepsy Society (2015), “Predict seizures in intracranial EEG recordings”, Availabe https://www.kaggle.com/c/seizure-prediction 25 J Zahra and K.S Hemant (2010), “Detection and classification of EEG waves”, Oriental Journal of Computer Science & Technology, 3(1), pp 207-213 26.A Evrim (2007), “Multiway analysis of epilepsy tensor”, Bioinformatics, 23, pp 10-18 ... kinh não Trong khi, gai động kinh xuất điện não đồ trước sau co giật xuất Cả xung động kinh gai động kinh xem bất thường liệu EEG Trong nghiên cứu này, loại bất thường mà quan tâm xung động kinh. .. thống phát xung động kinh liệu EEG mổ tả sau: Dữ liệu Ma trận hệ số Tensor EEG Xây dựng tensor Phân tích tensor Phát Biểu diễn đồ thị bất thường bất thường Hình 1.7 Mơ hình hệ thống phát xung động. .. Bất thường phương pháp phát bất thường phổ biến 1.1.1 Bất thường 1.1.2 Các phương pháp phát bất thường phổ biến 1.2 Phát xung động kinh liệu EEG 1.2.1 Bệnh động kinh xung