Chương 1 giới thiệu các kiến thức cơ bản về điện não đồ, động kinh và chuẩn đo điện não quốc tế1020. Tiếp theo, luận án giới thiệu quá trình đo và thu thập dữ liệu, cơ sở dữ liệu điện não đồ của các bệnh nhân bị động kinh sử dụng trong luận án. Để đánh giá chất lượng của các hệ thống đa bước phát hiện gai động kinh đã đề xuất, trong chương1luận án trình bày một số kiến thức cơ sở về ma trận đánh giá và đường cong ROC. Đây là hai công cụ thường được sử dụng để đánh giá chất lượng của các hệ thống phân loại được sử dụng trong nhiều ứng dụng, đặc biệt là trong các ứng dụng
về y tế. Cuối cùng, chương1giới thiệu những kiến thức cơ bản về ten-xơ, các phương pháp phân tích ten-xơ, phương pháp xấp xỉ hạng thấp đa tuyến tính cho các ten-xơ. Đây là các kiến thức là cơ sở cho các đề xuất được trình bày trong chương3.
CHƯƠNG 2.
HỆ THỐNG ĐA BƯỚC TỰ ĐỘNG PHÁT HIỆN GAI ĐỘNG KINH ĐƠN KÊNH
2.1. Giới thiệu
Trong những năm qua hướng nghiên cứu về hệ thống tự động phát hiện gai động kinh hỗ trợ cho chẩn đoán bệnh động kinh đã nhận được nhiều sự quan tâm của các nhà nghiên cứu [5, 43, 52, 81, 94, 109, 127]. Một số phương pháp phát hiện gai động kinh tự động đã đề xuất được tổng hợp trong [31, 36]. Trong các công trình nghiên cứu này, có cả hệ thống đơn bước và hệ thống đa bước. Một trong những nghiên cứu đầu tiên của hệ thống đơn bước là áp dụng một mô hình tự hồi quy để phát hiện gai động kinh tự động. Trong nghiên cứu [43], các tiêu chí và quy trình xác định gai động kinh của các bác sĩ thần kinh được thực hiện bằng cách phân tích tín hiệu EEG thành các sóng thành phần. Các kỹ thuật học máy như mạng nơ-ron nhân tạo [16, 95, 97], phân cụm theo tiêu chí K-mean [109] và máy véc tơ hỗ trợ (SVM) [5] được sử dụng để phát hiện gai động kinh từ dữ liệu EEG thô hay trích xuất các đặc trưng từ dữ liệu EEG thô để huấn luyện và kiểm tra.
Một số công trình nghiên cứu đề xuất hệ thống đa bước để phát hiện gai động kinh hiệu quả có thể kể đến như công trình nghiên cứu [6, 52, 81]. Hệ thống do Liu và cộng sự đề xuất năm2002[81] sử dụng kết hợp nhiều phương pháp xử lý tín hiệu như bộ lọc thích nghi, biến đổi sóng con, mạng nơ-ron nhân tạo ANN và hệ chuyên gia để phát hiện các dạng động kinh (epileptiform). Năm2004, Acir và cộng sự [6] xây dựng một hệ thống theo dõi lâm sàng và sử dụng một quy trình ba bước để phát hiện tự động các dạng động kinh trong tín hiệu EEG. Tuy nhiên, hệ thống được đề xuất bởi Acir và đồng nghiệp không sử dụng phương pháp xử lý tín hiệu trên miền thời gian-tần số đồng thời nào, do vậy hệ thống không khai thác được thế mạnh của các phương pháp này trong việc phân tích tín hiệu không dừng (tín hiệu EEG là tín hiệu không dừng). Các hệ thống đa bước có hiệu suất phát hiện gai động kinh tốt hơn các hệ thống đơn bước [5, 43, 52, 68, 81, 94, 109, 127] . Tận dụng ưu điểm của hệ thống đa bước, trong chương 2 luận án đề xuất một hệ thống đa bước tự động phát hiện gai
động kinh hiệu quả, khắc phục những hạn chế [Hạn chế 1,2] của các hệ thống đa bước được đề xuất bởi [6, 81].
Cấu trúc chương2được trình bày như sau: mục 2.1 giới thiệu tổng quan một số hệ thống đa bước tự động phát hiện gai động kinh tự động. Mục 2.2 trình bày hệ thống đa bước tự động phát hiện gai động kinh. Mục 2.3 trình bày phương pháp ước lượng đường cong ROC tổng hợp cho hệ thống đa bước. Mục 2.4 trình bày các kết quả mô phỏng, đánh giá hệ thống và cuối cùng, mục 2.5 trình bày kết luận của chương2.
2.2. Hệ thống đa bước tự động phát hiện gai động kinh đơn kênh
Hình 2.1. Sơ đồ khối của hệ thống đa bước tự động phát hiện gai động kinh đơn kênh.
Sơ đồ khối của mô hình hệ thống đa bước phát hiện tự động gai động kinh được biểu diễn trên hình 2.1. Hệ thống gồm4 bước: tiền xử lý, trích xuất đặc trưng,phân loại và hệ chuyên gia. Chức năng của từng bước được mô tả vắn tắt như sau:
Bước Tiền xử lý: đầu tiên, tín hiệu EEG ban đầu được lọc nhiễu do điện lưới gây ra. Sau đó, tất cả các đỉnh nhỏ trong tín hiệu EEG sau khi lọc này được loại bỏ. Tiếp theo, với mỗi đỉnh tương đối lớn 3 cặp đặc trưng (hay 6 đặc trưng) liên quan đến hình thái của một gai động kinh là biên độ, thời gian và độ dốc được tính và đưa vào ba perceptron khác nhau để phân các đỉnh này thành hai nhóm như sau:1) nhóm
các gai có thể là gai động kinh (dương tính) và2) nhóm các gai không động kinh (âm tính). Nhóm các gai có thể là gai động kinh sẽ là đầu vào của bước trích xuất đặc trưng.
Bước trích xuất đặc trưng: các gai có thể là gai động kinh (dương tính) sau bước tiền xử lý được phân tích bằng cách sử dụng biến đổi sóng con. Sử dụng phép biến đổi sóng con liên tục với sóng mẹ là Mexican hat, trong mỗi thang tỉ lệ ta thu được 7đặc trưng của gai (cả gai động kinh và gai không động kinh). Các đặc trưng của gai này là đầu vào của bước phân loại.
Bướcphân loại: các đặc trưng của gai động kinh và gai không động kinh được đưa vào để huấn luyện một mạng ANN để tạo ra một tập các đầu ra. Các giá trị của tập đầu ra này nằm trong khoảng [0,1]. Nếu một giá trị ở đầu ra của mạng ANN gần với giá trị1hoặc giá trị0được xác định là gai động kinh hoặc gai không động kinh, tương ứng. Các gai được xác định là gai động kinh là đầu ra của mạng ANN được đưa vào đầu vào của hệ chuyên gia.
Bước hệ chuyên gia: để loại bỏ các gai không động kinh (giả gai) ở vị trí gần gai động kinh nhằm khai thác mối liên hệ về thời gian giữa các gai động kinh gần nhau, luận án sử dụng một hệ chuyên gia áp dụng một thuật toán đơn giản.
Chức năng cụ thể của từng bước trong hệ thống đa bước tự động phát hiện gai động kinh đơn kênh được trình bày trong các mục từ mục 2.2.1 đến mục 2.2.4.
2.2.1. Tiền xử lý
Trong tín hiệu EEG, thời gian tồn tại của gai động kinh thông thường trong khoảng từ20 tới70 mili giây, và được đặc trưng bởi một đường cong dốc, đi lên và sau đó đi xuống ngay lập tức [91]. Các gai động kinh xuất hiện bất thường và có thể xuất hiện dưới dạng độc lập hoặc kết hợp. Gai động kinh thường được ghi lại ở những khu vực não bị tổn thương và thường xuất hiện trước một sóng chậm kéo dài từ150tới
350mili giây [13]. Hình thái của gai là đa dạng và phức tạp tùy thuộc vào từng bệnh nhân và điều kiện ghi điện não đồ.
Một số gai động kinh trong tập dữ liệu luận án sử dụng được biểu diễn trên hình 2.2. Hình 2.3 biểu diễn 6đặc trưng của một đỉnh [6] là các đầu vào của mạng perceptron trong bước tiền xử lý: biên độ cạnh trước (a1), thời gian tồn tại cạnh trước (d1), biên độ cạnh sau (a2), thời gian tồn tại cạnh sau (d2), độ dốc cạnh trước (s1) và
Hình 2.2. Một số gai động kinh thực tế trong tập dữ liệu. Đường tròn màu đỏ minh họa vị trí đỉnh gai động kinh và hình ngôi sao minh họa vị trí đỉnh gai không động kinh.
độ dốc cạnh sau (s2). Trên cùng một tập dữ liệu EEG, các bác sĩ thần kinh đưa ra ý kiến đánh giá khác nhau về sự xuất hiện của gai động kinh. Do đó, kết quả đánh giá không chỉ phụ thuộc vào độ phức tạp của tín hiệu EEG mà còn phụ thuộc vào kinh nghiệm của các bác sĩ thần kinh.
Do một gai động kinh có hình dạng của một đỉnh tín hiệu, vì vậy việc tìm tất cả các đỉnh trong tập dữ liệu là rất cần thiết để tìm các gai động kinh một cách chính xác. Trong hệ thống đề xuất, giá trị của một đỉnh đang xét được so sánh với2 đỉnh gần nhất. Nếu đỉnh có giá trị lớn nhất, đỉnh đó được xác định là một đỉnh dương và nếu giá trị đỉnh là nhỏ nhất, nó sẽ được xác định là một đỉnh âm. Sau khi xác định tất cả các đỉnh trong dữ liệu EEG, các đỉnh nhỏ chắc chắn không phải là gai động kinh được loại bỏ dựa trên các tiêu chí ngưỡng sau: khoảng cách giữa một cặp đỉnh liền kề nhỏ hơn khoảng cách giữa cặp đỉnh liền kề trước và sau đó. Tức là, cho các đỉnhpi1,
a1 a2 d1 d2 s1 a1 d1 s 2 a2 d2
Hình 2.3. Sáu đặc trưng của một đỉnh gai động kinh [6].
pi, pi 1, pi 2 xuất hiện tại các thời điểm ti1, ti, ti 1, ti 2, nếu khoảng cách từ đỉnh pi tớipi 1 nhỏ hơn khoảng cách từ đỉnhpi1 tới đỉnhpi và khoảng cách từ đỉnh pi 1 tới đỉnhpi 2, thì đỉnh pi và đỉnh pi 1 được loại bỏ. Thời gian tồn tại của gai (tức là, d1 d2) và trung bình của biên độ cạnh trước và biên độ cạnh sau (pa1 a2q{2) (như biểu diễn trên hình 2.3) nhỏ hơn20mili giây và17.5µV [91]. Bước tiền xử lý giúp hệ thống loại bỏ được các tín hiệu nhiễu không mong muốn và do đó, nhận biết được các gai động kinh dễ dàng hơn.
Hình 2.4. Mạng nơ-ron gồm 3 perceptron.
Trong bước tiền xử lý, luận án sử dụng 3perceptron, trong đó mỗi perceptron làmột nơ-ron đơn lẻ để phân loại các đỉnh quan trọng thành hai nhóm là nhóm gồm
các đỉnh không phải là gai động kinh và nhóm gồm các đỉnh là gai không động kinh. Tương tự với kết quả nghiên cứu trong [6], luận án sử dụng 3cặp đặc trưng bao gồm đặc trưng về biên độ (biên độ cạnh trướca1, biên độ cạnh saua2), thời gian (thời gian tồn tại cạnh trướcd1, thời gian tồn tại cạnh saud2) và độ dốc (độ dốc cạnh trướcs1và độ dốc cạnh saus2) của một gai động kinh như được biểu diễn trên hình 2.3. Đây là3
cặp đầu vào của3perceptron. Khác với cách sử dụng perceptron trong [6], luận án sử dụng3perceptron (hình 2.4), đầu vào của mỗi perceptron là một cặp trong3cặp đặc trưng được trích xuất từ mỗi đỉnh. Trong [6], Acir và đồng nghiệp đề xuất sử dụng
2perceptron trong đó đầu vào của mỗi perceptron là6đặc trưng của1gai (3cặp đặc trưng về biên độ, thời gian và độ dốc). Sau khi đi qua2perceptron này các đỉnh trong tín hiệu EEG sẽ được phân thành 3 nhóm riêng biệt gồm nhóm 1) chắc chắn là dạng động kinh; nhóm 2) chắc chắn là dạng không động kinh và nhóm 3) có thể là dạng động kinh. Trong2perceptron này,1perceptron được huấn luyện sao cho đầu ra của perceptron là ( 1), đỉnh đó thuộc nhóm chắc chắn là dạng không động kinh và (1) là đỉnh đó thuộc các dạng khác. Perceptron thứ2được huấn luyện sao cho đầu ra là ( 1) với đỉnh chắc chắn là dạng động kinh và (1) đối với các dạng còn lại. Một đỉnh có đầu ra là (1) đối với cả hai perceptron sẽ được gán vào nhóm thứ3là có thể là dạng động kinh và có thể là dạng không động kinh. Các đỉnh thuộc nhóm thứ3sẽ tiếp tục được xử lý ở bước thứ2 sử dụng mạng RBFN. Như vậy sau khi qua các perceptron, các đỉnh thuộc nhóm 1được khẳng định là dạng động kinh, chỉ khảo sát dạng động kinh trên miền thời gian và sẽ không khảo sát ở bước tiếp theo. Luận án đề xuất sử dụng3perceptron trong đó đầu vào của mỗi perceptron là1cặp đặc trưng (thời gian, biên độ và độ dốc) của gai. Mỗi perceptron được huấn luyện sao cho đầu ra là ( 1) là thuộc nhóm1) có thể là gai động kinh và (0) là thuộc nhóm 2) gai không động kinh. Một đỉnh được xác định là thuộc nhóm1) khi đầu ra của cả3perceptron đều là ( 1). Qua mạng perceptron, các đỉnh có thể là gai động kinh tiếp tục được khảo sát trên miền tần số nhờ sử dụng biến đổi sóng con liên tục sử dụng sóng mẹ là Mexican hat ở bước trích xuất đặc trưng. Kết quả của bước tiền xử lý, khoảng 75%các đỉnh được phân loại là gai không động kinh và chỉ25%các đỉnh được phân loại là có thể là gai động kinh, được tiếp tục khảo sát ở bước2. Hình 2.4 biểu diễn mạng nơ-ron gồm 3
perceptron để xác định các đỉnh có thể là gai động kinh trong tập tất cả các đỉnh của tín hiệu EEG. Đầu vào của mạng perceptron là 6 đặc trưng của gai được biểu diễn
trên hình 2.3. Như biểu diễn trên hình 2.4, đầu ra của mỗi perceptron là0hoặc1. Một đỉnh được xác định là một gai động kinh (thuộc về nhóm2) nếu và chỉ nếu đầu ra của cả3perceptron này đều là1.
2.2.2. Trích xuất đặc trưng C C A B D E F G a CD w aCE FG wDE wAB N M
Hình 2.5. Bẩy đặc trưng của một gai động kinh trong một thang tỉ lệ biến đổi sóng con [81].
Ngày nay, kỹ thuật phân tích tín hiệu trong miền thời gian - tần số thường sử dụng là phép biến đổi sóng con [21, 28, 102]. Phép biến đổi sóng con được áp dụng thành công vào việc phân tích tín hiệu EEG như trong [65, 105, 106], để phát hiện gai động kinh như trong [79, 90, 101, 125] và phát hiện xung động kinh như trong [7, 42, 67, 121]. Cách lựa chọn kiểu sóng con và số lượng thang tỉ lệ trong biến đổi sóng con sẽ đưa ra các kết quả, độ chính xác khác nhau. Khi phân tích tín hiệu EEG sử dụng phép biến đổi sóng con liên tục tốt hơn biến đổi sóng con rời rạc vì phép biến đổi sóng con liên tục cho phép khảo sát tín hiệu tại bất kỳ thang tỉ lệ nào [12]. Tận dụng ưu điểm của biến đổi sóng con liên tục để phát hiện gai động kinh, luận án sử dụng biến đổi sóng con liên tục để trích chọn các đặc trưng.
Biến đổi sóng con liên tục được xây dựng từ một hàm sóng mẹ ψptq được định nghĩa như sau:
ψa,τptq ?1 aψ tτ a , (2.1)
Biến đổi sóng con liên tục (CWT) của một tín hiệu được định nghĩa theo công thức sau: CW Tpxptq;a, τq ?1 a »8 8xptqψ a,τptqdt, (2.2) trong đó pq biểu thị toán tử liên hợp phức. Trong luận án, sóng mẹ được chọn là Mexican hat do có khả năng khai thác hiệu quả thông tin không dừng của gai động kinh [79].
Sóng mẹ mexican hat,ψptq, được định nghĩa như sau:
ψptq ? 2 3σπ1{4 1 t2 σ2 et2{2σ2, (2.3)
trong đóσlà một hằng số tương tự như độ lệch chuẩn của phân phối thống kê [88]. Đặc điểm hình thái cơ bản của dạng động kinh có liên quan đến biên độ và thời gian. Các gai động kinh có thời gian từ20đến70mstrong khi sóng sắc có thời gian từ70đến200ms. Vì cả gai động kinh và sóng sắc có thể là một cơn động kinh. Theo quan điểm lâm sàng, không có sự khác biệt quá lớn giữa gai động kinh và sóng sắc, vì vậy có thể xem xét rằng các sự kiện là dạng động kinh thay đổi từ20đến200ms[13]. Trong [81], các tín hiệu EEG có độ dài khác nhau được phân tích sử dụng phép biến đổi sóng con liên tục và sau biến đổi sóng con, các gai động kinh nổi bật trong 8
thang tỉ lệ đầu tiên. Khi thực hiện khảo sát năng lượng của các gai động kinh sử dụng biến đổi sóng con trong tập dữ liệu luận án sử dụng,5thang tỉ lệ từ thang tỉ lệ 4đến thang tỉ lệ8là có mức năng lượng cao nhất. Vì vậy, luận án đề xuất sử dụng 5thang tỉ lệ này trong phép biến đổi sóng con ở bước trích xuất đặc trưng. Với tần số lấy mẫu F s256Hz, luận án sử dụng một cửa sổ gồm56mẫu dữ liệu tương đương với218ms