V. Kết luận
1 Đặc trưng thống kê (miền thời gian) của tín hiệu
4.2 Phương pháp tiếp cận: Phân loại bằng máy vec-tơ hỗ trợ SVM
Trong phần này, chúng ta giới thiệu phương pháp dự đoán phát hiện sớm động kinh bằng phương pháp phân loại sử dụng máy vec-tơ hỗ trợ SVM (sử dụng đặc trưng đơn biến).
Hình 4.2.1: Mô hình phân loại sử dụng SVM
Mỗi kênh EEG là một tín hiệu điện đo được từ một điện cực cố định ngoài da (surface-EEG, sEEG) hoặc trong não (intracranial-EEG, iEEG). Tín hiệu này qua bộ lọc notch để loại bỏ nhiễu 50 (60) Hz sau đó sẽ được trích chọn các (một số) đặc trưng. Từng đặc trưng này được tính trong một cửa sổ trượt 5 giây.
Chúng ta có thể minh họa cho bài toán phân loại 4 trạng thái của não. Đầu ra mạng SVM là các nhãn (giá trị số) gán liên quan đến các vector đầu vào: 1 đối với
inter-ictal, 2 cho pre-ictal, 3 cho ictal và 4 cho post-ictal. Mạng phân loại SVM là mạng ánh xạ 1-1, tuy nhiên điều chúng ta quan tâm nhất là trạng thái tiền động kinh
pre-ictal, do đó nhãn 2 trở thành nhãn quan trọng nhất.
Trong trường hợp bài toán ta sử dụng phân loại hai lớp thì các mẫu pre-ictal sẽ được phân loại với các loại mẫu còn lại. Trong trường hợp này đầu ra chỉ có hai nhãn, chẳng hạn 2 cho pre-ictal và 1 cho các mẫu khác.
Do lỗi phân loại và nhiễu trong dữ liệu, nên việc xuất hiện một chuỗi toàn nhãn 2 là điều ít khi xảy ra, tuy nhiên trong các chuỗi nhãn nếu chuỗi nào có tần suất nhãn 2 nhiều thì có thể xem là dấu hiệu của trạng thái tiền động kinh. Trong thuật toán đề xuất, đối với từng bộ dữ liệu, chúng ta sẽ phân tích từng cửa sổ trượt (tương đương với khoảng thời gian pre-ictal được sử dụng) và nếu hơn một nửa các giá trị đầu ra trong cửa sổ này được gán nhãn pre-ictal (nhãn 2) thì một cảnh báo sẽ được đưa ra.
Trường hợp nếu cơn động kinh xuất hiện (đã được đánh dấu trong dữ liệu) trong khoảng thời gian sau cảnh báo có một dự đoán dương tính thật TP (True Positive) còn nếu không ta sẽ có dự đoán dương tính giả FP (False Positive). Khi trạng thái pre-ictal không được xác định và cơn động kinh xuất hiện ta có dự đoán
Lấy đặc trưng theo từng kênh Ma trận đặc trưng Phân loại bởi SVM Hậu xửlý Phân tích kết quả Tín hiệu EEG đa kênh
âm tính giả FN (False Negative) và dự đoán âm tính thật TN (True Negative) xảy ra khi không xuất hiện cơn.
Khái niệm độ nhạy (SS-Sensitivity) và tỷ lệ đoán sai (FPR- False Prediction per hour) được sử dụng để đánh giá kết quả, được định nghĩa như sau:
TP SS
TP FN
=
+ (4.1)
(tỷ lệ số cơn dự đoán được/tổng số cơn động kinh).
Một cơn động kinh được xem là dự đoán đúng nếu khi cảnh báo được đưa ra và khởi phát cơn động kinh xảy ra ngay sau khoảng thời gian pre-ictal tiếp theo.
( )
1 FP
FPRh
interictal duration FP SOP
− =
− × (4.2)
SOP (Seizure Occurrence Period) là khoảng thời gian xảy ra (theo dự đoán) động kinh (chọn bởi thuật toán) liên quan đến các cảnh báo sai.
Ngoài ra, ta có thể sử dụng thêm các khái niệm độ đặc hiệu (SP-Specificity) và độ chính xác (AC-Accuracy) được định nghĩa:
TN SP TN FP = + (4.3) TN TP AC TN FN TP FP + = + + + (4.4) 4.3 Kết luận
Trên đây là mô hình tổng quan và trình bày chi tiết các bước khi tiếp cận sử dụng máy véc-tơ hỗ trợ SVM trong dự đoán phát hiện sớm động kinh. Việc chẩn đoán bệnh động kinh được thực hiện lần lượt theo các bước sau: thu thập dữ liệu, tiền xử lý tín hiệu, trích chọn các đặc trưng, phân loại và hậu xử lý tín hiệu. Luận văn sử dụng phương pháp phân loại sử dụng máy vec-tơ hỗ trợ SVM (sử dụng đặc trưng đơn biến) trong việc phân loại tín hiệu EEG đa kênh: tín hiệu EEG đa kênh được đưa vào lấy đặc trưng theo từng kênh sau đó tổ hớp thành ma trận đặc trưng, sau đó được phân loại bởi SVM, tín hiệu được phân loại sẽ qua quá trình hậu xử lý để đưa ra kết quả, kết quả cuối cùng sẽ được đưa ra phân tích và đánh giá.
Chương 5 - MỘT SỐ ĐÁNH GIÁ VỀ THU ĐƯỢC
Kết quả mô phỏng trong chương này được thực hiện trên bộ cơ sở dữ liệu về động kinh của ĐH Freiburg (CHLB Đức) bằng phương pháp sử dụng SVM.