Luận văn này giải quyết vấn đề dự báo thời điểm chuẩn bị xảy ra cơn động kinh. Bệnh động kinh xảy ra trên 1% dân số thế giới, đặc trưng bởi những cơn động kinh tự phát. Một trong những cách ngăn ngừa động kinh là tiêm thuốc liều cao, kéo theo phản ứng phụ không mong muốn. Bên cạnh đó, việc sử dụng thuốc hay phẫu thuật đôi khi không có hiệu quả, khiến người bệnh luôn trong tình trạng lo lắng cơn động kinh có thể kéo đến bất cứ lúc nào. Việc xây dựng một hệ thống dự báo những cơn động kinh có thể xảy ra giúp cho bệnh nhân có được một cuộc sống bình thường hơn. Nhờ đó, họ có thể biết mà tránh các hoạt động dễ gây nguy hiểm như lái xe, bơi lội hay sử dụng thuốc khi cần thiết.
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ LÊ HOÀNG ANH PHÁT HIỆN BẤT THƯỜNG BẰNG PHÂN TÍCH TENSOR ĐỂ NHẬN BIẾT XUNG ĐỘNG KINH TRONG DỮ LIỆU ĐIỆN NÃO Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 8480104.01 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN LINH TRUNG Hà Nội – 11/2018 i LỜI CAM ĐOAN Tôi xin cam đoan kết nghiên cứu luận văn riêng chưa cơng bố cơng trình nghiên cứu Hà nội, ngày 15 tháng 11 năm 2018 Học viên Lê Hoàng Anh ii MỤC LỤC LỜI CAM ĐOAN i Danh mục ký hiệu, chữ viết tắt iv Danh mục bảng v Danh mục hình vẽ, đồ thị vi MỞ ĐẦU vii LỜI CẢM ƠN ix CHƯƠNG 1.1 TỔNG QUAN VỀ LUẬN VĂN Bất thường phương pháp phát bất thường phổ biến 1.1.1 Bất thường 1.1.2 Các phương pháp phát bất thường phổ biến 1.2 Phát xung động kinh liệu EEG 1.2.1 Bệnh động kinh xung động kinh 1.2.2 Các phương pháp phát xung động kinh 1.3 Phân tích ten-xơ 1.4 Khái quát nội dung luận văn 10 CHƯƠNG NGHIÊN CỨU CƠ SỞ 12 2.1 Các khái niệm ten-xơ 12 2.2 Thuật tốn phân tích HOSVD 15 2.3 Biến đổi sóng liên tục - CWT 17 CHƯƠNG HỆ THỐNG PHÁT HIỆN XUNG ĐỘNG KINH SỬ DỤNG HOSVD 19 3.1 Biểu diễn liệu EEG 19 iii 3.2 Trích trọn đặc trưng 21 3.3 Phân loại 23 CHƯƠNG KẾT QUẢ THỰC NGHIỆM VÀ KẾT LUẬN 25 4.1 Tập liệu 25 4.2 Đánh giá thuật toán 28 4.3 Kết 30 4.4 Kết luận 36 TÀI LIỆU THAM KHẢO 38 iv Danh mục ký hiệu, chữ viết tắt STT Ký hiệu, viết tắt Tên đầy đủ Giải thích EEG Electroencephalography Điện não đồ CP/PARAFAC Paralel Factor Analysis PCA Principal component analysis Phân tích thành phần Tucker Tucker Phân tích Tucker HOSVD Higher-order singular value decomposition Phân tích trị riêng bậc cao CWT Continueous Wavelet Transform Biến đổi sóng liên tục DWT Discrete Wavelet Transform Biến đổi sóng rời rạc SVM Support Vector Machine Máy vec-tơ hỗ trợ KNN K-Nearest Neighbors K láng giềng gần 10 ROC Receiver Operating Charateristic Đường cong ROC 11 TPR True Positive Rate Tỉ lệ phát 12 FPR False Positive Rate Tỉ lệ phát nhầm 13 AUC Area Under the Curve Diện tích nằm đường cong ROC Phân tích hệ số song song v Danh mục bảng Bảng 4-1 Đánh giá chất lượng mơ hình 34 Bảng 4-2 So sánh SVM với KNN 35 Bảng 4-3 So sánh HOSVD với CP 36 vi Danh mục hình vẽ, đồ thị Hình 1.1: Ví dụ điểm bất thường khơng gian hai chiều [2] Hình 1.2 Ví dụ bối cảnh bất thường [2] Hình 1.3 Ví dụ bất thường tập hợp tín hiệu điện tim Hình 1.4 Mơ hình thu thập liệu EEG Hình 1.5 Ví dụ xung động kinh cục [10] Hình 1.6 Ví dụ xung động kinh toàn [5] Hình 1.7 Mơ hình hệ thống phát xung động kinh liệu EEG sử dụng phân tích ten-xơ 10 Hình 2.1 Ten-xơ ba chiều 12 Hình 2.2 Các lát cắt ten-xơ bậc [21] 13 Hình 2.3 Các chế độ ten-xơ bậc ba [21] 13 Hình 2.4.Phân tích SVD 15 Hình 2.5 Phân tích HOSVD cho ten-xơ bậc 16 Hình 2.6 Thuật tốn HOSVD 17 Hình 3.1 Mô tả hệ thống phát xung động kinh 19 Hình 3.2 Quá trình tạo ten-xơ bậc 20 Hình 3.3 Hàm Mexican hat 21 Hình 3.4 Mơ tả q trình trích chọn đặc trưng 22 Hình 4.1 Tín hiệu EEG số kênh liệu EEG 25 Hình 4.2 Đoạn liệu kiểm thử chứa liệu dẫn tới co giật 26 Hình 4.3 Phân tích Fourier tín hiệu EEG 27 vii MỞ ĐẦU Động kinh loại rối loạn thần kinh, đặc trưng xung động kinh xuất lặp lặp lại nhiều lần Theo nghiên cứu tổ chức WHO vào tháng năm 2018, giới có khoảng 50 triệu người mắc bệnh động kinh, hầu hết người mắc bệnh động kinh nằm nước nghèo phát triển [1], máy móc để phục vụ cho việc chuẩn đoán bệnh lại tốn Trong việc chẩn đoán bệnh động kinh sử dụng liệu điện não (EEG), hệ thống phát xung động kinh tự động xác hữu ích có ý nghĩa, đặc biệt trường hợp việc đọc liệu EEG phát xung động kinh ghi tốn thời gian, công sức, tính hiệu lại phụ thuộc vào trình độ bác sĩ chẩn đoán Nhận thức vấn đề này, chúng tơi đặt tốn xây dựng hệ thống phát xung động kinh liệu điện não EEG Trong nghiên cứu này, truyền cảm hứng từ thành công việc áp dụng phân tích ten-xơ vào ứng dụng thực tế nói chung y học nói riêng, chúng tơi áp dụng phân tích HOSVD, loại phân tích ten-xơ, để nhận biết xung động kinh liệu EEG Cụ thể hơn, trước tiên, biến đổi sóng liên tục (CWT) sử dung để chuyển đổi đoạn liệu điện não đồ EEG hai chiều thành ten-xơ bậc với chiều mặt thời gian, khơng gian tần số Tiếp theo đó, xếp chồng tenxơ đại diện cho xung động kinh liệu thành ten-xơ bậc 4, trước phân tích HOSVD để thu ma trận tải thành phần Các ma trận sau sử dụng để xây dựng không gian đặc trưng cho xung động kinh theo phương pháp Cuối cùng, sử dụng hai phân loại quen thuộc học máy gồm SVM KNN để viii nhận biết xung động kinh từ đặc điểm thu từ việc chiếu ten-xơ EEG lên không gian đặc trưng vừa huấn luyện Kết thực nghiệm rằng, hệ thống nhận biết xung động kinh sử dụng phân tích HOSVD liệu EEG cho kết phân loại tốt thời điểm xuất xung động kinh thời điểm “bình thường” Đồng thời, chúng tơi so sánh phương pháp đề xuất với phương pháp dựa phân tích ten-xơ khác CP/PARAFAC Kết cho thấy hiệu HOSVD với độ nhạy 99% tốt so với 75% CP ix LỜI CẢM ƠN Tôi xin chân thành cảm ơn hướng dẫn tận tình PGS TS Nguyễn Linh Trung, PGS TS Phan Xuân Hiếu, TS Nguyễn Việt Dũng, ThS Nguyễn Thị Anh Đào, em Lê Trung Thành anh chị em Phòng thí nghiệm Tín hiệu Hệ thống giúp đỡ tơi hồn thành nghiên cứu Tơi cảm ơn gia đình, bạn bè anh em công ty ủng hộ tạo điều kiện cho suốt quãng thời gian học tập nghiên cứu Tôi xin bày tỏ lòng biết ơn đến đề tài nghiên cứu khoa học số 102.02-2015.32 quỹ phát triển khoa học công nghệ Quốc gia (National Foundation for Science and Technology Development - NAFOSTED) tài trợ cho hội thực nghiên cứu 26 Hình 4.1 mơ tả tín hiệu EEG kênh khác lấy từ tập liệu Kaggle, với thời điểm từ 25001 đến 50000 có chứa xung động kinh Có thể thấy, việc người bình thường xác định thời điểm xảy xung động kinh khó Bên cạnh đó, hình 4.2 biểu diễn thời xảy xung động kinh khác mà EEG (mV) mắt thường dễ dàng nhận Hình 4.2 Đoạn liệu kiểm thử chứa liệu dẫn tới co giật Trong q trình tiền xử lý, chúng tơi nhận thấy rằng, thơng thường tần số sóng điện não chia thành dải tần sau [25]: (i) dải delta (