1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Ứng dụng máy học vector hỗ trợ SVM trong dự đoán cơn động kinh

12 59 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Bài viết đề xuất một phương pháp sử dụng máy học vector hỗ trợ SVM (Support Vector Machine) để dự đoán cơn động kinh dựa trên các bản ghi tín hiệu điện não đồ EEG (Electroencephalography). Phương pháp này sử dụng các đặc trưng đơn biến của tín hiệu EEG nhằm phân loại bốn trạng thái tín hiệu EEG (bình thường, tiền động kinh, động kinh và sau động kinh).

TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) ỨNG DỤNG MÁY HỌC VECTOR HỖ TRỢ SVM TRONG DỰ ĐOÁN CƠN ĐỘNG KINH A METHOD BASED ON SVM TO PREDICT EPILEPTIC SEIZURES Nguyễn Văn Sơn1*, Vương Hoàng Nam2, Đào Xuân Phúc1, Vũ Duy Thuận3 Trường Đại học Mở Hà Nội, 2Trường Đại học Bách khoa Hà Nội, 3Trường Đại học Điện lực Ngày nhận bài: 11/10/2019, Ngày chấp nhận đăng: 25/12/2019, Phản biện: TS Nguyễn Hữu Phát Tóm tắt: Bệnh động kinh xem bệnh liên quan đến rối loạn não phổ biến thứ hai ảnh hưởng đến khoảng 1% dân số giới Đặc trưng động kinh xuất kiểm soát co giật (cơn động kinh) Trong báo này, đề xuất phương pháp sử dụng máy học vector hỗ trợ SVM (Support Vector Machine) để dự đoán động kinh dựa ghi tín hiệu điện não đồ EEG (Electroencephalography) Phương pháp sử dụng đặc trưng đơn biến tín hiệu EEG nhằm phân loại bốn trạng thái tín hiệu EEG (bình thường, tiền động kinh, động kinh sau động kinh) Việc dự đốn xác động kinh phụ thuộc vào khả nhận dạng/phân biệt trạng thái tiền động kinh (pre-ictal) với ba trạng thái lại Các kết mơ với sở liệu động kinh Đại học Freiburg cho thấy tính hữu dụng phương pháp đề xuất Từ khóa: Máy học vector hỗ trợ (SVM), dự đốn động kinh, tín hiệu điện não đồ (EEG) Abstract: Epilepsy is the second most common brain disorder and affects approximately 1% of the world’s population Epilepsy is characterized by the occurrence of unforeseenable and uncontrollable seizures In this paper, we propose a method based on SVM (Support Vector Machine) to predict epileptic seizures using EEG (Electroencephalography) recordings In this method, univariate features are used to classify four states of EEG (inter-ictal, pre-ictal, ictal and post-ictal) Seizure forecasting requires the ability to reliably identify a pre-ictal state that can be differentiated from the inter-ictal, ictal, and post-ictal state Computer simulation experiments with the Freiburg EEG database show the utility of the proposed method Keywords: Torque constant; permanent magnet synchronous machine, state estimation, nonlinear observation, parameter identification GIỚI THIỆU Động kinh bệnh mãn tính, nhiều nguyên nhân khác gây ra, đặc trưng lặp lặp lại Số 21 phóng điện mức, đồng thời tế bào thần kinh não bộ, triệu chứng lâm sàng cận lên sàng khác Các loại động kinh biểu 39 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) vơ đa dạng hình thành nên “thế giới động kinh” Ngày động kinh vấn đề quan trọng ngành y tế bệnh lý mà xã hội ngành y tế cần đặc biệt quan tâm di chứng nặng nề ảnh hưởng đến chất lượng sống, khả học tập công tác, hòa nhập cộng đồng xã hội, đặc biệt đối với trẻ em Hiện việc điều trị thuốc lựa chọn hàng đầu, giúp hạn chế tác hại động kinh đối với người bệnh Tuy nhiên thực tế sống người bệnh động kinh chịu ảnh hưởng nặng nề động kinh xuất bất chợt, khơng dự đốn Điện não đồ (EEG - Electroencephalogram) đo biểu diễn thay đổi điện theo thời gian điện cực đặt vị trí khác da đầu tương ứng với vùng vỏ não Thông qua đặc trưng biên độ, tần số, phân bố khơng gian, hình thái, phân cực điện thế, EEG cho biết thông tin hoạt động não Dựa thơng tin đó, chun gia đánh giá, phân tích biểu bất thường não để phát bệnh động kinh dựa xuất gai động kinh EEG Các nghiên cứu gần giới tập trung theo hướng dự đoán phát sớm động kinh (dựa tín hiệu EEG) với mục tiêu tạo thiết bị gắn kèm với người bệnh có khả phát co giật trước xảy Điều giúp người bệnh (đặc biệt trẻ em) nhiều việc chủ động đối phó với bệnh động kinh [1,2] Trong báo đưa phương pháp dự đoán trước động 40 kinh sử dụng máy học vector hỗ trợ SVM (Support Vector Machine) đặc trưng trích chọn từ tín hiệu EEG Kết đánh giá phương pháp đề xuất thực sở liệu động kinh Đại học Freiburg (CHLB Đức) [3] MƠ HÌNH BÀI TỐN DỰ ĐỐN CƠN ĐỘNG KINH Trong báo, chọn nghiên cứu toán phát sớm (dự đoán) xuất động kinh người bệnh Trong trường hợp đối tượng nghiên cứu ghi tín hiệu điện não đồ EEG đa kênh với đặc trưng lựa chọn bao gồm biên độ, tần số bản, hình dạng vị trí khơng gian ghi nhận da đầu (scalp)… phân loại dựa đặc trưng học mẫu học lấy từ tín hiệu EEG người bệnh Mơ hình toán đề xuất thực chất toán phân loại mẫu tín hiệu EEG gồm bước:     Thu thập liệu; Tiền xử lý liệu; Trích chọn đặc trưng; Phân loại hậu xử lý 2.1 Thu thập liệu Trong cơng trình khoa học nghiên cứu nhận dạng, phát bệnh lý động kinh chủ yếu sử dụng sở liệu (CSDL) chuẩn đánh dấu (nhận dạng) chuyên gia y tế Trong báo, sử dụng CSDL Đại học Freiburg CSDL động kinh sử dụng phổ biến nghiên cứu Bộ Số 21 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) liệu gồm 18 bệnh nhân với tổng cộng 450 ghi với 79 động kinh [3] 2.2 Tiền xử lý tín hiệu Quá trình dùng để hạn chế loại bỏ nhiễu tín hiệu điện não EEG Chúng ta có ba cách: thứ ngăn chặn loại bỏ nguồn gây nhiễu; thứ hai tối thiểu hóa ảnh hưởng nguồn nhiễu; thứ ba nhận dạng loại bỏ tín hiệu nhiễu Phương pháp tốt để tín hiệu khơng có nhiễu ngăn chặn loại bỏ nguồn gây nhiễu, nhiên đối số loại nhiễu (như nhiễu nháy mắt, nhiễu cơ) phương pháp khơng khả thi Thứ hai ta hạn chế tối đa nhiễu bằng việc sử dụng thiết bị kỹ thuật đo đạc đại có độ nhạy cao, khả lọc nhiễu tốt, nhiên phương pháp đắt tiền phức tạp Trong cách thứ ba, việc sử dụng thuật tốn xử lý tín hiệu số dễ dàng nhận dạng nguồn nhiễu loại bỏ chúng Phương pháp không yêu cầu thiết bị phần cứng phức tạp đắt tiền mà có tính linh hoạt cao nhận dạng loại bỏ nhiễu khỏi tín hiệu điện não Tuy nhiên phạm vi nghiên cứu báo, việc đánh giá kết dựa CSDL chuẩn (đã xử lý nhiễu) nên trình xử lý bỏ qua 2.3 Trích chọn đặc trưng Mơ hình cửa sổ trượt sử dụng trích chọn đặc trưng tín hiệu EEG (hình 1) Mỗi cửa sổ xem mẫu tín hiệu cần nhận dạng Cửa sổ trượt có độ dài xác định trước Số 21 đặc trưng tín hiệu EEG tính tốn (phân tích) cửa sổ [1,2] Độ dài cửa số thường nằm khoảng 540 giây Sau phân tích cửa sổ trượt trả lại giá trị phản ánh đặc trưng kênh khác kênh ghi EEG Trong nghiên cứu này, khoảng thời gian cửa sổ chọn 5s Khoảng thời gian cửa sổ trượt phải nhằm thỏa mãn điều kiện:  Khoảng thời gian đủ ngắn để trình xử lý xem tĩnh (stationary process)  Khoảng thời gian đủ dài để “bắt” (trích chọn) đặc trưng cụ thể mẫu tín hiệu EEG Hình Phương pháp cửa sổ trượt để trích chọn đặc trưng tín hiệu EEG 2.4 Phân loại hậu xử lý Trong toán phân loại này, phân làm loại tín hiệu (hình 2) gồm: tín hiệu bình thường (ký hiệu interictal), tiền động kinh (pre-ictal), động kinh (ictal) tín hiệu sau động kinh (post-ictal)  Ictal: xác định đoạn tín hiệu gắn hoạt động động kinh não Hoạt động có độ dài thay đổi thường kéo dài gần khoảng ba phút [4]  Pre-ictal: xác định khoảng thời 41 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) gian trước khởi phát động kinh (seizure onset) Khơng có định nghĩa y học cụ thể giai đoạn Mormann et al 2007 [4] cho thay đổi điện sinh lý học kéo dài nhiều phút đến hàng trước động kinh  Post-ictal: xác định khoảng thời gian (thường 510 phút) hoạt động não sau kết thúc (seizure offset) trở lại trạng thái bình thường [4]  Inter-ictal: đoạn tín hiệu khơng động kinh (bình thường), gọi nằm trước trạng thái pre-ictal nằm sau trạng thái post-ictal Hình Phân loại trạng thái tín hiệu động kinh Trong mơ hình tốn, đầu phân loại giá trị nhãn gán liên quan đến vector đầu vào: chẳng hạn đối với interictal, cho pre-ictal, cho ictal cho post-ictal Tuy nhiên điều quan tâm dự đoán động kinh trạng thái tiền động kinh pre-ictal, nhãn trở thành nhãn quan trọng Quá trình hậu xử lý dựa sở phát khoảng thời gian tiền động kinh (pre-ictal), cho phép đưa cảnh báo sớm động kinh xảy (hình 3) 42 Hình Mơ hình dự đốn đưa cảnh báo trước động kinh PHƯƠNG PHÁP ĐỀ XUẤT Phương pháp đề xuất xây dựng dựa mơ hình tốn dự đốn động kinh trình bày phần với hai q trình gồm: q trình chọn đặc trưng tín hiệu EEG trình phân loại hậu xử lý 3.1 Các đặc trưng tín hiệu EEG Các đặc trưng sử dụng để phân loại trạng thái tín hiệu: bình thường, tiền động kinh, động kinh sau động kinh (inter-ictal, pre-ictal, ictal post-ictal) từ ghi tín hiệu EEG người bệnh động kinh Trong thực tế loại động kinh biểu đa dạng thân tín hiệu điện EEG có biến thiên lớn (ngay đối với tín hiệu bình thường) đặc trưng tần số, biên độ, hình dạng vị trí Điều có nghĩa khơng tồn đặc trưng có mối quan hệ định lượng xác với trạng thái tín hiệu EEG động kinh Điều dẫn đến dự đoán động kinh ta phải sử dụng nhiều đặc trưng tín hiệu EEG Các đặc trưng chia làm hai loại: đặc trưng đơn biến (univariate) lấy từ kênh liệu EEG [5] đặc trưng lưỡng biến/đa biến (bivariate/multivariate) tính tốn dựa cặp (hoặc nhiều hơn) kênh tín hiệu EEG [6] Trong Số 21 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) báo, sử 22 đặc trưng đơn biến Jalil Rasekhi et al, 2013 [7] để phát động kinh Dữ liệu EEG trước tiên phân đoạn theo cửa sổ 5s đặc trưng đơn biến lấy từ cửa sổ tín hiệu EEG thể thơng tin biên độ lẫn pha/tần số kênh tín hiệu EEG Câu hỏi đặt liệu số lượng đặc trưng chọn đủ để dùng dự đốn xác động kinh việc lấy thêm đặc trưng khác (chẳng hạn đặc trưng đa biến) liệu có làm tăng độ xác dự đoán? Thực tế việc sử dụng nhiều số đặc trưng làm tăng độ xác phân loại trạng thái tín hiệu đồng thời dẫn đến khối lượng tính tốn vơ lớn Điều có nghĩa khơng thể thực xử lý gần tức thời (on-line) tín hiệu EEG độ trễ xử lý lớn Ngoài để đưa cảnh báo dự đoán động kinh, sử dụng thêm trình hậu xử lý (mục 3.2) Quá trình đưa định cuối mà không cần độ xác gần tuyệt đối q trình phân loại trạng thái tín hiệu 3.2 Q trình phân loại hậu xử lý Để xây dựng hệ thống tự động phân biệt trạng thái tín hiệu điện não đồ, sử dụng máy học vector hỗ trợ SVM [8] Bản chất SVM phân loại nhị phân gồm lớp (nhãn) đầu SVM gốc thiết kế cho toán phân lớp nhị phân, nhiên nhiều ứng dụng thực tế buộc phải giải tốn Số 21 phân loại nhiều lớp Vì mơ hình SVM đa lớp nghiên cứu phát triển để đáp ứng với dạng toán phân loại nhiều lớp Để phân loại lớp đối tượng (trường hợp này) cần tổ hợp SVM (SVM đa lớp) Một số chiến lược thường dùng cho toán SVM đa lớp: Một đối một, đối phần lại chiến lược phân cấp Trong trường hợp này, kỹ thuật đối (one-against-one) sử dụng [9] Kỹ thuật mô tả sau: Với cặp lớp phân loại, cần xây dựng máy phân lớp nhị phân, máy phân lớp huấn luyện tập tập huấn luyện mà tập chứa mẫu huấn luyện cặp lớpphân loại Như vậy, phải xây dựng tất k(k-1)/2 máy phân lớp nhị phân với k số lớp (trường hợp với lớp trạng thái tín hiệu cần máy học SVM), máy kết nối lại với thông qua phương pháp bỏ phiếu để đánh giá kết phân lớp cuối cùng, lớp có số phiếu cao chọn làm kết dự đoán (max-win) Chiến lược sử dụng hầu hết phần mềm mã nguồn mở SVMlight, LIBSVM, SVMTorch HeroSvm Trong đánh giá, đầu mạng SVM đa lớp nhãn (giá trị số) gán liên quan đến vector đầu vào: đối với inter-ictal, cho pre-ictal, cho ictal cho postictal Tuy nhiên điều quan tâm dự đoán động kinh phát trạng thái tiền động kinh pre-ictal để tạo cảnh báo sớm động kinh xảy ra, nhãn trở thành nhãn quan trọng 43 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) Quá trình tạo cảnh báo thực sau phân loại Các SVM phân loại “huấn luyện” dựa mẫu học (learning) Một cách lý tưởng, phân loại SVM (đã huấn luyện tốt) phân loại xác tất mẫu liệu kiểm tra (test) tạo đầu xác Tuy nhiên, thực tế, hệ thống phân loại phân loại xác tuyết đối tất mẫu Do đầu sử dụng trực tiếp để dự đốn động kinh dẫn đến với mẫu bị phân loại nhầm thành pre-ictal tạo cảnh báo sai động kinh Để nâng cao chất lượng dự đoán, Teixeira et al (2012) đưa thủ tục tạo cảnh báo [10] Do sai số phân loại, nên việc xuất khoảng thời gian với chuỗi nhãn phân loại toàn nhãn (pre-ictal) điều xảy ra, nhiên chuỗi nhãn chuỗi có tần suất nhãn nhiều xem khoảng thời gian có dấu hiệu trạng thái tiền động kinh Trong báo, đề xuất giải pháp khoảng thời gian ghi tín hiệu EEG (được xem khoảng thời gian tiền động kinh, phần mô chọn khoảng thời gian 30 phút), số lượng phân loại pre-ictal (nhãn 2) vượt 50% cảnh báo khả xuất động kinh thời điểm tương lai gần đưa KẾT QUẢ MƠ PHỎNG 4.1 Các thơng số mơ 4.1.1 Chọn kênh tín hiệu EEG Như giới thiệu 2.1, 44 CSDL ĐH Freiburg gồm 18 bệnh nhân với tổng số khoảng 450 ghi 79 động kinh Mỗi ghi gồm tín 27 kênh điện cực (hệ thống 1020) bao gồm: FT10, T10, TP10, F8, T4, T6, FP2, F4, C4, P4, O2, FPZ, FZ, CZ, PZ, OZ, FP1, F3, C3, P3, O1, F7, T3, T5, FT9, T9, TP9 Ngồi có kênh dùng để ghi kèm liệu tín hiệu điện tâm đồ ECG (Electrocardiagram) người bệnh (hình 4) Hình Một phần ghi liệu bệnh nhân CSDL Freiburg với 27 kênh tín hiệu EEG kênh tín hiệu ECG (trong vị trí EEG_ON EEG-OFF đánh dấu vị trí bắt đầu kết thúc động kinh) Trên thực tế, việc sử dụng tín hiệu tất kênh (27 kênh) dẫn đến khối lượng tính tốn cực lớn Ngồi việc sử dụng nhiều kênh tín hiệu đồng nghĩa với việc người bệnh phải gắn nhiều điện cực người (trong trường hợp sử dụng thiết bị cầm tay phát sớm động kinh) Điều gây bất tiện cho bệnh nhân Do phần thực nghiệm, sử dụng tổ hợp gồm kênh tín hiệu (để nghiên cứu) nhằm phát sớm động kinh Sáu kênh tín Số 21 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) hiệu chọn theo tiêu chí bao phủ khơng gian Sáu kênh tín hiệu chọn gồm: F7, FZ, F8, T5, PZ T6 cho nhìn khơng quan tổng quan trạng thái não bệnh nhân Theo tiêu chuẩn hệ thống vị trí đặt điện cực 10-20 quốc tế vị trí đo F7, FZ, F8, T5, PZ T6 bao phủ khu vực phía trước, vùng thái dương 4.1.2 Chọn đặc trưng tín hiệu Chúng ta sử dụng cửa sở trượt 5s để trích chọn đặc trưng cho kênh tín hiệu EEG chọn, cửa sổ 5s xem mẫu phân loại thuộc trạng thái (inter-ictal, pre-ictal, ictal, post-ictal) Do sử dụng đặc trưng đơn biến gồm 22 đặc trưng (mục 3.1), mẫu cần phân loại (cửa sổ 5s kênh) có 132 giá trị đặc trưng Như đầu vào mạng phân loại vector (mẫu) 132 chiều 4.2 Kết mô đánh giá 4.2.1 Bộ liệu học kiểm tra Bộ CSDL EEG chia làm hai phần: liệu học, gọi huấn luyện (learning) kiểm tra (testing) Bộ liệu học gồm khoảng 250 ghi 48 động kinh sử dụng để tối ưu thông số hệ thống phân loại (SVM đa lớp) liệu kiểm tra (gồm khoảng 200 ghi 31 động kinh lại, khơng dùng trình học) sử dụng để kiểm tra tính hiệu phân loại thiết kế từ trình học Số 21 4.2.2 Một số kết mô thảo luận Ở tiến hành đánh giá dựa liệu EEG sáu kênh tín hiệu (F7, FZ, F8, T5, PZ T6) với khoảng thời gian pre-ictal chọn 30 phút trước động kinh, post-ictal chọn 10 phút sau động kinh Trường hợp xác định trạng thái tiền động kinh (pre-ictal) động kinh xuất khoảng thời gian sau cảnh báo ta có dự đốn dương tính thật TP (True Positive) khơng xuất ta có dự đốn dương tính giả FP (False Positive) Khi trạng thái tiền động kinh (pre-ictal) khơng xác định có động kinh xuất ta có dự đốn âm tính giả FN (False Negative) Trong trường hợp TP xem cảnh báo còn FP FN cảnh báo sai Để đánh giá kết ta sử dụng khái niệm độ nhạy (SS-Sensitivity) tỷ lệ đoán sai (FPR/h- False Prediction per hour)[11] SS định nghĩa tỷ lệ số dự đoán được/tổng số động kinh ghi người bệnh Trong FPR/h định nghĩa: FPRh1  False Alarm Hours of Testing    seizures  preictal time  (1) tỷ lệ số cảnh báo sai/ lượng thời gian hữu dụng Trong cảnh báo sai xuất trường hợp có FP FN (có cảnh báo khơng có động kinh khơng có cảnh báo lại xuất động kinh) Để xác định lượng thời gian hữu 45 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) dụng lấy tổng số thời gian ghi tín hiệu EEG người bệnh trừ tổng số thời gian dùng tạo cảnh báo (bằng số động kinh nhân với khoảng thời gian pre-ictal chọn) [11] Về mặt lý thuyết kết thu tối ưu (tuyệt đối) đạt giá trị SS=100% FPR/h=0 thực tế mong muốn kết thu với giá trị SS cao FPR/h thấp Kết (tốt nhất) đối với liệu học thu tỷ lệ phát động kinh 39/48 cơn, đạt tỷ lệ 81,25 % Dựa thông số học, tiến hành thử nghiệm liệu test Kết thu tỷ lệ phát 21/31 cơn, đạt tỷ lệ 67,74 % Hình vẽ thể tỷ lệ phát đông kinh bệnh nhân CSDL Đại học Freiburg với tỷ lệ trung bình (cả trình học test) 75,9% Điều cho thấy khả ứng dụng triển vọng phương pháp đề xuất báo Trong mô này, cảnh báo sai dương tính giả FP-False Positive (có cảnh báo khơng xuất động kinh) Trong liệu kiểm tra, với 10 không nhận diện được, có số cảnh báo sai tương ứng với 10 dự đốn âm tính giả FN tỷ lệ FPR/h (đối với liệu kiểm tra) đạt 0,055 Việc khơng có cảnh báo sai dương tính giả FP tỷ lệ FPR/h thấp kết hạn chế báo số lượng bệnh nhân, số loại (vị trí ổ bệnh) động kinh CSDL đánh giá chưa nhiều đa dạng Mặc dù khơng có tỷ lệ cụ thể chung giá trị SS tối thiểu hay FPR cực đại 46 dùng để đánh giá đối với thuật toán, Teixeira et al 2014 [11] đưa tỷ lệ dự đoán chấp nhận (để ứng dụng y tế) phải dự đoán (đúng) 50% số động kinh (SS>50%) tỷ lệ cảnh báo sai không lần khoảng thời gian (FPR/h50% FPR/h

Ngày đăng: 15/05/2020, 23:44

Xem thêm:

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w