Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
2,27 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ================== NGUYỄN THỊ ANH ĐÀO MỘTSỐPHƯƠNGPHÁPXỬLÝTÍNHIỆUĐIỆNNÃOHỖTRỢCHUẨN ĐỐN BỆNHĐỘNGKINH Ngành: Công nghệ Điện tử – Viễn thông Chuyên ngành: Kỹ thuật Viễn thông Mã số: 62520208 TĨM TẮT LUẬN ÁN TIẾN SỸ CƠNG NGHỆ ĐIỆN TỬ - VIỄN THƠNG Hà Nội, 2018 CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ, ĐẠI HỌC QUỐC GIA HÀ NỘI NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN LINH TRUNG Phản biện 1: Phản biện 2: Phản biện 3: Luận án bảo vệ trước Hội đồng cấp sở Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Vào hồi: ……h…… ngày…… tháng…… năm 2018 Có thể tìm hiểu luận án tại: - Thư viện Quốc gia - Thư viện Đại học Quốc gia Hà Nội MỞ ĐẦU Bối cảnh nghiên cứu Độngkinh (epilepsy) rối loạn thần kinh đặc trưng xuất xung độngkinh lặp lặp lại nhiều lần rối loạn nghiêm trọng phổ biến não Tỉ lệ bệnhđộngkinh chiếm 1% sốbệnh tật tồn cầu Năm 2010, giới có khoảng 50 triệu người mắc bệnhđộng kinh, có khoảng gần 40 triệu người bị độngkinh nước phát triển Việt Nam nước phát triển có tỉ lệ người mắc bệnhđộngkinh cao Theo báo cáo năm 2008 tỉ lệ số người mắc bệnhđộngkinh Việt Nam 0, 44% Một xét nghiệm lâm sàng quan trọng hay sử dụng để chẩn đoán theo dõi tiến triển bệnhđộngkinh đo điệnnão đồ bệnh nhân Điệnnão đồ (EEG – Electroencephalogram) cách sử dụng mũ điện cực ghi lại hoạt độngđiệnnão Dựa vào quan sát điệnnão đồ, bác sĩ chẩn đốn bệnhđộng kinh, thể loại độngkinh khu vực não bị tổn thương, thông qua dấu ấn sinh học độngkinh thể điệnnão đồ Dấu ấn sinh học độngkinh gồm xung độngkinh (epileptic seizures) số dạng sóng độngkinh gai độngkinh (epileptic spikes), sóng sắc (sharp wave), phức hợp gai sóng, đa gai Gai độngkinh xuất trước sau độngkinh Tại Việt Nam, việc chẩn đoán nhầm bệnhđộngkinh tuyến huyện tỉnh xảy phổ biến Việc chẩn đoán nhầm bệnhđộngkinh dẫn đến nhiều hệ lụy như: Có bệnh nhân bị độngkinh thời gian đo ngắn, tínhiệu có nhiều nhiễu khơng xửlý lọc nhiễu nên bác sĩ không phát bệnh, dẫn đến trường hợp người bệnh bị bệnhđộngkinh không điều trị Bệnhđộngkinh có nhiều loại độngkinh khác nhau, việc chẩn đốn khơng xác dẫn đến việc cho thuốc độngkinh khơng loại gây tác dụng phụ khơng mong muốn có trường hợp làm bệnhtrở thành nặng Trong gần 40 năm qua, có nhiều cơng trình nghiên cứu nhận biết dấu ấn sinh học (biomarkers) bệnhđộngkinh nhận biết xung độngkinh (seizures) kết hợp với lâm sàng số xét nghiệm khác để chẩn đốn thể độngkinh Ở Việt Nam đo giám sát 24{24, trừ bệnh nhân bị bệnh nặng cần phẫu thuật bỏ phần não tổn thương gây nên độngkinh để điều trị Vì vậy, khó khăn để có liệu điệnnão đồ có chứa xung độngkinh Việt Nam để nghiên cứu Mặt khác, bệnh nhân xuất xung độngkinh tức trường hợp bệnh nhân bị bệnh nặng Ngoài ra, hoạt động khác não nhiễu (do điều kiện ghi điệnnão chưa theo chuẩn quốc tế) tạo gai khơng độngkinh (giả gai) tínhiệu EEG, dễ gây nhầm lẫn cho bác sĩ dẫn đến tượng chẩn đốn nhầm bệnh Vì vậy, để hỗtrợ cho bác sĩ việc chẩn đoán, phát bệnhđộngkinh giai đoạnbệnh nhẹ, tức xuất gai độngkinhtínhiệuđiệnnão đồ, luận án đặt vấn đề nghiên cứu sốphươngphápxửlýtínhiệu để nhận biết gai độngkinh tự động, sử dụng kỹ thuật xửlýtínhiệu tiên tiến nhằm tăng tính khách quan độ xác việc phát gai độngkinh Tổng quan nhanh hạn chế nhận biết gai độngkinh tự động Do việc dò gai thủ cơng tốn nhiều thời gian bác sĩ nên việc xây dựng hệ thống để phát gai độngkinh tự động hướng nghiên cứu quan tâm Việt Nam giới Việc tự động phát gai độngkinh cung cấp thơng tin mật độ gai hội chứng bệnhđộngkinh Trong năm vừa qua, có nhiều cơng trình nghiên cứu tự động phát gai độngkinh Trong nhiều thập kỷ qua, nhiều phươngpháp khác đề xuất để giải vấn đề phát gai độngkinh Ktonas (1974), Gotman (1976), Pfurtscheller (1978), Liu (2002), Acir (2005), Indiradevi (2008) có hệ thống đơn bước hệ thống đa bước Về bản, hệ thống đa bước có hiệu suất cao hệ thống đơn bước Các hệ thống đa bước hành chưa xửlýhiệu sử dụng nhiều tỉ lệ biến đổi sóng con, nhiều giả gai chưa khai thác mối liên hệ ga i gần Trong thực tế, khả xuất gai độngkinh kênh gần thời điểm cao, nên phươngphápxửlý đa kênh đồng thời cho phép khai thác mối liên hệ theo không gian gai động kinh, tăng khả phát gai độngkinh Hiện nay, có nhiều nghiên cứu sử dụng phân tích ten-xơ để phân tích tínhiệuđiệnnão phát xung độngkinh Cong (2015), Acar (2007), deburchgraeve (2009), Pippa (2016) Tuy nhiên, nhóm nghiên cứu chưa nghiên cứu nhận biết gai độngkinh đa kênh, chưa khai thác mối liên hệ không gian gai độngkinh kênh gần thời điểm Vấn đề nghiên cứu Xây dựng hệ thống phát gai độngkinh tự động đơn kênh đề xuất phươngpháp ước lượng đường cong ROC cho hệ thống đa bước Xây dựng hệ thống phát gai độngkinh đa kênh dựa phân tích ten-xơ thông qua liên hệ không gian Mục tiêu nghiên cứu 4.1 Mục tiêu chung Nghiên cứu cải tiến phươngphápxửlýtínhiệuhỗtrợ nhận biết gai độngkinh cách khai thác mối liên gai gần theo thời gian dựa phân tích liệu EEG đơn kênh khơng gian dựa phân tích liệu EEG đa kênh đồng thời 4.2 Mục tiêu cụ thể ˝ Xây dựng hệ thống đa bước thực nhận biết gai độngkinhhiệu quả, khai thác mối liên hệ gai gần theo thời gian đề xuất phươngpháp ước lượng đường cong ROC cho hệ thống đa bước sử dụng nhiều ngưỡng định (hệ thống xếp tầng) ˝ Xây dựng hệ thống nhận biết gai độngkinh nhằm khai thác mối liên hệ gai gần theo không gian sử dụng phươngpháp phân tích ten-xơ Đưa tốn cách giải toán xấp xỉ hạng thấp đồng thời cho ma trận, ten-xơ đưa thuật toán giải tốn xấp xỉ hạng thấp đa tuyến tính đồng thời mở rộng cho ten-xơ (SLMRAT) Hướng tiếp cận phươngpháp ‚ Đối với mục tiêu 1, hướng tiếp cận khai thác liên hệ thời gian theo thơng tin hình thái học gai độngkinh mà Boos (2011) đặt ra; cải tiến tiền xử lý, phươngpháp trích xuất đặc trưng hệ thống đa bước để nâng cao hiệu phát gai độngkinh ‚ Đối với mục tiêu 2, hướng tiếp cận khai thác thông tin đa kênh (không gian), tức mối liên hệ gai độngkinh kênh gần thời điểm, sử dụng phươngpháp phân tích ten-xơ, dựa phươngpháp đề xuất pippa (2016) Phan (2010) Nội dung nghiên cứu Luận án tập trung nghiên cứu hai nội dung sau: 1) Cải tiến bước tiền xử lý, trích chọn đặc trưng, xây dựng hệ chuyên gia đơn giản khai thác thông tin gai độngkinh gần Nghiên cứu phươngpháp ước lượng đường cong ROC để đánh giá chất lượng hệ thống đa bước có nhiều ngưỡng định 2) Xây dựng hệ thống phát gai độngkinh đa kênh sử dụng phươngpháp phân tích ten-xơ Trong nội dung nghiên cứu, nội dung trình bày cụ thể chương nội dung trình bày chi tiết chương Đóng góp luận án Hai đóng góp luận án là: ‚ Xây dựng hệ thống đa bước phát gai độngkinh dựa việc phân tích tínhiệu EEG đơn kênh, khai thác mối liên hệ theo thời gian gai độngkinh gần kênh Cụ thể sau: - Cải tiến cải tiến bước tiền xử lý: cách sử dụng số lượng perceptron; bước trích xuất đặc trưng: cải tiến sử dụng số tỉ lệ biến đổi sóng con; hệ chuyên gia: khai thác mối liên hệ thời gian gai độngkinh xuất gần - Để đánh giá chất lượng hệ thống đa bước: luận đề xuất phươngpháp ước lượng ROC tổng thể cho hệ thống phân loại đa bước sử dụng nhiều ngưỡng định dựa hai phân bố phân bố Gaussian phân bố Logistic ‚ Xây dựng hệ thống đa bước để phát gai độngkinh tự dựa việc phân tích tínhiệu EEG đa kênh, khai thác mối liên hệ theo không gian gai độngkinh kênh gần Cụ thể sau: - Luận án đưa toán ước lượng hạng thấp đa tuyến tính cho ten-xơ đồng thời (SLMRAT) đưa thuật toán để giải toán SLMRAT sử dụng phươngpháp phân tích ten-xơ Tucker-ALS phân tích Tucker với ràng buộc khơng âm (NTD) để tìm khơng gian đặc trưng gai độngkinh Tính đắn thuật tốn đề xuất để giải toán SLMRAT trường hợp cụ thể HOSVD, Tucker-ALS NTD luận án chứng minh phần phụ lục - Trong bước lựa chọn đặc trưng hệ thống phát gai độngkinh đa kênh, luận án đề xuất phươngpháp lựa chọn đặc trưng kết hợp hai phươngpháp lựa chọn đặc trưng thông dụng điểm Fisher trị số p cách sử dụng thuật tốn tìm chuỗi chung lớn Bố cục luận án Luận án trình bày gồm phần mở đầu chương Chương 1: trình bày kiến thức sở cho hai nội dung nghiên cứu mà luận án đưa như: điệnnão đồ; động kinh; gai động kinh; xung động kinh; ma trận đánh giá; đường cong ROC; chuẩn đo quốc tế 10 ´ 20; khái niệm ten-xơ; phân tích ten-xơ xấp xỉ hạng thấp đa tuyến tính cho ten-xơ Chương trình bày hệ thống đa bước tự động phát gai độngkinh đơn kênh, kết mô phỏng, đánh giá hệ thống Chương trình bày hệ thống đa bước phát gai độngkinh đa kênh dựa phân tích ten-xơ; mơ đánh giá; toán thuật toán giải toán xấp xỉ hạng thấp đa tuyến tính mở rộng cho ten-xơ Chương trình bày kết luận hướng phát triển, danh mục tài liệu tham khảo công trình cơng bố luận án CHƯƠNG CƠ SỞ VÀ TỔNG QUAN 1.1 Điệnnão đồ Điệnnão đồ (EEG) biểu đồ biểu diễn thay đổi hiệuđiệntínhiệu ghi da đầu cách sử dụng điện cực Biên độ tínhiệu EEG nằm dải từ vài µV đến xấp xỉ 200 µV Tần sốtínhiệu EEG nằm khoảng r0.5, 70s Hz Hình 1.1 minh họa liệu điệnnão đồ bệnh nhân bị độngkinh tập liệu luận án sử dụng Hình 1.1 Dữ liệu điệnnão đồ bệnh nhân tập liệu luận án sử dụng EEG tổng hợp nhịp nhịp delta, theta, alpha, beta gamma Nhịp delta có tần số khoảng r0.5, 4s Hz, nhịp theta có tần số khoảng r4, 7.5s Hz, nhịp alpha có tần số khoảng r8, 13.5s Hz, nhịp beta có tần số khoảng r14, 30s Hz nhịp gamma có tần số lớn 30 Hz 1.2 ĐộngkinhĐộngkinh hay gọi độngkinh phong định nghĩa rối loạn não mãn tính đặc trưng xuất xung độngkinh lặp lặp lại nhiều lần Xung độngkinh kết phóng điện bất thường, đồng mức nơ-ron thần kinhnão Đặc trưng độngkinh biểu co giật, ý thức tạm thời Trong chẩn đoánđộng kinh, bác sĩ thường dựa vào dấu hiệu nhận biết điệnnão đồ người bệnh hình dạng, mật độ xuất dạng độngkinh (gai động kinh, sóng nhọn, phức hợp sóng gai, đa gai sóng, phức hợp đa gai ) để xác định vị trí khởi phát dạng độngkinh tình trạng bệnh người bệnh 1.3 Gai độngkinh Gai độngkinh (epileptic spike) dạng độngkinh bác sĩ sử dụng phổ biến chẩn đoánbệnhđộngkinh Thời gian tồn gai độngkinh ngắn, thường khoảng r20, 70s mili giây, đặc trưng đường dốc lên xuống đột ngột, tạo đỉnh nhọn Hình 1.2 minh họa điệnnão đồ có chứa gai độngkinh Hình 1.2 Điệnnão đồ có chứa gai độngkinh 1.4 Xung độngkinh Xung độngkinh (epileptic seizure) thường xuất xảy độngkinh (cơn co giật) người bệnh Xung độngkinh thường đo đo giám sát người bệnh 24{24 bệnh viện Hình 1.3 minh họa liệu điệnnão đồ chứa xung độngkinh 1.5 Ma trận đánh giá Các xét nghiệm chẩn đoán y học thường sử dụng để phân loại bệnh nhân thành hai nhóm có bệnh hay khơng có bệnh tùy theo có hay khơng có Hình 1.3 Tínhiệuđiệnnão đồ có chứa xung độngkinh triệu chứng, dấu hiệu bị bệnh Trong luận án, thuật ngữ dương tính âm tính sử dụng để biểu diễn kết xét nghiệm có hay khơng có bệnh Để định lượng khả chẩn đoán xét nghiệm người ta thường sử dụng ma trận đánh giá Hai tham số quan trọng ma trận đánh giá thường sử dụng độ nhạy SEN độ đặc hiệu SPE Độ nhạy tỷ lệ dương tính thật độ đặc hiệu SPE tỷ lệ âm tính thật Với xét nghiệm, việc lựa chọn phươngpháp có tỉ lệ dương tính thật (độ nhạy) cao hay tỉ lệ âm tính thật (độ đặc hiệu) cao tùy thuộc vào mục tiêu xét nghiệm tùy thuộc vào trả giá 1.6 Đường cong ROC Đường cong ROC (receiver operating characteristic) đồ thị hai chiều biểu diễn mối liên hệ tỉ lệ dương tính thật (SENθ ) tỉ lệ dương tính giả (1 ´ SPEθ ) hệ thống phân loại nhị phân ngưỡng phân loại thay đổi θ Diện tích đươi đường cong ROC, AUC số sử dụng để so sánh chất lượng phân loại hệ thống phân loại Các hệ thống phân loại có đường cong ROC khác đường cong có giá trị AUC chất lượng phân loại hệ thống 1.7 Chuẩn đo quốc tế 10-20 Các chuẩn đo quốc tế nói chung chuẩn đo quốc tế 10 ´ 20 nói riêng xây dựng phát triển nhằm tạo sở liệu thống theo chuẩn đo Điều mang đến nhiều lợi ích cho phép so sánh tínhiệuđiệnnão CHƯƠNG HỆ THỐNG ĐA BƯỚC TỰ ĐỘNG PHÁT HIỆN GAI ĐỘNG KÊNH ĐƠN KÊNH 2.1 Giới thiệu Tận dụng ưu điểm hệ thống đa bước, chương luận án đề xuất hệ thống đa bước tự động phát gai độngkinhhiệu quả, khắc phục hạn chế hệ thống đa bước đề xuất Liu (2002) Acir (2005) Cấu trúc chương trình bày sau: mục 2.2 trình bày hệ thống đa bước tự động phát gai độngkinh Mục 2.3 trình bày phươngpháp ước lượng đường cong ROC tổng thể cho hệ thống đa bước Mục 2.4 trình bày kết mơ đánh giá cuối cùng, mục 2.5 trình bày kết luận chương 2.2 Hệ thống đa bước tự động phát gai độngkinh đơn kênh Hình 2.1 Sơ đồ khối hệ thống đa bước tự động phát gai độngkinh đơn kênh Sơ đồ khối mơ hình hệ thống đa bước phát tự động gai độngkinh biểu diễn hình 2.1 Hệ thống gồm bước: tiền xử lý, trích xuất đặc trưng, phân loại hệ chuyên gia 11 ˝ Bước Tiền xử lý: đầu tiên, tínhiệu EEG ban đầu lọc nhiễu (nhiễu mắt, nhiễu nhiễu điện lưới gây ra) Sau đó, tất đỉnh nhỏ tínhiệu EEG sau lọc loại bỏ Tiếp theo, với đỉnh tương đối lớn cặp đặc trưng (hay đặc trưng) liên quan đến hình thái gai độngkinh biên độ, thời gian độ dốc tính đưa vào ba perceptron khác để phân đỉnh thành hai nhóm sau: 1) gai gai độngkinh (dương tính) 2) gai khơng độngkinh (âm tính) ˝ Bước trích xuất đặc trưng: gai gai độngkinh (dương tính) sau bước tiền xửlý phân tích cách sử dụng biến đổi sóng Với phép biến đổi sóng con, tỉ lệ ta thu đặc trưng gai (cả gai độngkinh gai không động kinh) Luận án sử dụng tỉ lệ dải từ tỉ lệ đến tỉ lệ ˝ Bước phân loại: đặc trưng gai độngkinh gai không độngkinh đưa vào để huấn luyện mạng ANN để tạo tập đầu Các giá trị tập đầu nằm khoảng [0, 1] Nếu giá trị đầu mạng ANN gần với giá trị giá trị xác định gai độngkinh gai không động kinh, tương ứng ˝ Bước hệ chuyên gia: để chắn gai phát mạng ANN gai động kinh, luận án sử dụng hệ chuyên gia áp dụng thuật toán đơn giản để loại bỏ gai khơng độngkinh (giả gai) vị trí gần gai độngkinh nhằm khai thác mối liên hệ thời gian gai độngkinh gần 2.3 Ước lượng đường cong ROC tổng thể cho hệ thống đa bước Với hệ thống phân loại đa bước sử dụng nhiều ngưỡng định, tập hợp điểm (SEN, ´ SPEq số trường hợp tạo đường cong khơng có đặc trưng giống đường cong ROC cổ điển Vì vậy, cần phải ước lượng hàm không giảm biểu diễn đường cong ROC tổng thể hệ thống Vì đường cong ROC cổ điển thường hàm phi tuyến không giảm, luận án sử dụng phép ánh xạ không gian điểm Pi pSENi , ´ SPEi q vào không gian vectơ thông qua phép biến đổi phi tuyến h : R2 Ñ R2 Luận án sử dụng phép ánh xạ với mục tiêu điểm Pi pSENi , ´ SPEi q không gian tạo thành đường cong ROC có đặc 12 trưng giống đường cong ROC cổ điển cách sử dụng phươngpháp hồi quy tuyến tính chung dựa vào hai phân bố gồm phân bố Gaussian phân bố Logistic 2.4 Mô đánh giá 2.4.1 Thu thập liệu Luận án sử dụng liệu điệnnão đồ ghi hệ thống ghi EEG theo chuẩn 10–20, gồm 19 kênh liệu, tốc độ lấy mẫu 256 Hz Thời gian ghi thay đổi ghi từ tới 28 phút Hệ thống ghi EEG có kèm theo máy ghi video đồng thời theo dõi chuyển độngbệnh nhân, tạo điều kiện thuận lợi cho bác sĩ thần kinh phân biệt nhiễu trình đánh giá Tập liệu gồm 17 bệnh nhân chẩn đốn bị bệnhđộng kinh, có 11 bệnh nhân nam bệnh nhân nữ Tập đữ liệu chia thành hai tập liệu tập liệu sử dụng để huấn luyện gồm 12 bệnh nhân tập liệu sử dụng để kiểm tra (đánh giá chất lượng hệ thống) gồm bệnh nhân Dữ liệu thô sau thu được lọc nhiễu sử dụng lọc thơng dải có dải tần từ 0.5 đến 75 Hz, lọc triệt tần Notch 50 Hz để loại bỏ nhiễu điện lưới Q trình lọc nhiễu khơng loại bỏ gai độngkinh tập liệu luận án sử dụng 2.4.2 Kết Các kết đánh giá chất lượng hệ thống đa bước tự động phát gai độngkinh đơn kênh biểu diễn hình vẽ bảng thống kê Hình 2.2 minh họa kết hệ thống theo bước đoạn liệu EEG có độ dài 5.86 giây (tương đương với 1500 mẫu) Hình 2.2 (a) biểu diễnđoạn liệu EEG gốc; (b) tất đỉnh đoạn liệu; (c) đỉnh nhỏ; (d) đỉnh lại sau loại bỏ đỉnh nhỏ; (e) đỉnh gai độngkinh cuối hình 2.2(f) biểu diễn đỉnh hệ thống xác định gai động kinh, so sánh gai độngkinh xác định hệ thống gai độngkinh đánh dấu bác sĩ Bảng 2.1 biểu diễnsố lượng gai độngkinh phát hệ thống theo bước tập liệu kiểm tra gồm bệnh nhân Tương ứng, tỉ lệ dương tính thật tỉ lệ âm tính thật biểu diễn Bảng 2.2 Ta thấy tỉ lệ dương tính thật 13 Hình 2.2 Kết hệ thống tự động phát gai độngkinh theo bước Bảng 2.1 Kết phát gai độngkinh hệ thống theo bước Bệnh nhân 5a 5b Tiền xửlý ANN Hệ chuyên gia all sig pos epil sure 1795728 1266464 3701808 2540528 1120848 1224816 1269227 477319 2388564 1829433 607211 979726 36885 6975 36361 24942 13251 14226 7160 945 4697 3913 3827 4589 6276 840 4357 3403 3144 3683 sig.“ đỉnh có ý nghĩa, pos “ đỉnh gai động kinh, epil “ gai độngkinh Bảng 2.2 Tỉ lệ dương tính thật (SEN) tỉ lệ âm tính thật (SPE) Bệnh nhân 5a 5b Thời gian đo Gai TP FP 11 phút 24 giây 27 phút 13 giây 16 phút 16 giây phút 31 giây 27 phút 37 giây 27 phút 37 giây 16 351 12 19 14 323 12 18 6262 839 4034 3391 3126 3674 FN TN 30609 6135 28 32004 21539 10107 10543 SEN SPE 87.50 83.01 100.00 87.97 92.02 88.80 100.00 86.40 94.74 76.37 100.00 74.16 bệnh nhân khác (nhỏ 87.5% lớn 100%) Lý có khác đặc tính độngkinhbệnh nhân, thấy rõ 14 bảng 2.2 thông qua độ dài ghi (Thời gian đo) số gai độngkinh (Gai) Hình 2.3 Các điểm pSEN, ´ SPEq hệ thống đa bước tự động phát gai độngkinh đơn kênh khơng gian ROC Hình 2.4 Đường cong ROC tổng thể hệ thống đa bước tự động phát gai độngkinh Hình 2.3 biểu diễn tập kết hệ thống việc thay đổi hai ngưỡng định phân loại ANN hệ chuyên gia Tuy nhiên, quan sát hình 2.3 điểm (SEN, ´ SPEq đường cong không giảm khoảng r0, 1s giống đường cong ROC cổ điển, đường cong tập hợp tất điểm diện pSEN, p1 ´ SPEq hệ thống không biểu diễnhiệu suất hệ thống đa bước đề xuất tham sốdiện tích đường cong khơng sử dụng để đánh giá chất lượng hệ thống Do vậy, luận án đề xuất phươngpháp 15 để ước lượng đường cong ROC tổng thể hệ thống đa bước.Đường cong ROC tổng thể biểu diễn hình 2.4 Như quan sát hình 2.4, hai đường cong ROC tổng hợp dựa theo hai phân bố phân bố Gaussian phân bố Logistic tuân theo điểm pSEN, ´ SPEq không gian ROC (đường cong ROC tổng hợp không giảm khoảng r0, 1s) Cả hai phươngpháp ước lượng đường cong ROC tổng thể hệ thống đa bước đưa kết tương tự với lỗi nhỏ (ă 0.02) giá trị AUC « 0.94 Bảng 2.3 Kết ước lượng ROC tổng thể hệ thống đa bước Phươngpháp Dựa phân bố Gaussian Dựa phân bố Logistic a b AUC Lỗi 0.24 3.8 0.9490 0.0157 0.1 3.9 0.9376 0.0093 2.5 Kết luận chương Chương giới thiệu hệ thống đa bước tự động phát gai độngkinh đơn kênh, hỗtrợ cho chẩn đoánbệnhđộng kinh, đặc biệt hữu ích Việt Nam nơi mà điều kiện ghi liệu điệnnão bị hạn chế Các kết mô cho thấy biên độ gai độngkinh lúc lớn biên độ tínhiệu liệu điệnnão đồ Trong thực tế, gai độngkinh khó phân biệt với tínhiệu liệu điệnnão có biên độ nhỏ Đối với trường hợp này, hệ chuyên gia luận án loại bỏ nhầm gai độngkinhsố lượng giả gai lại sau hệ chuyên gia nhiều Đây hạn chế hệ thống đa bước phát gai độngkinh đơn kênh, hạn chế tiếp tục nghiên cứu sau Ngoài ra, chương đề xuất phươngpháp để đánh giá chất lượng hệ thống phân loại đa bước sử dụng nhiều ngưỡng định ước lượng đường cong ROC tổng hợp dựa phân bố Gaussian phân bố Logistic Phươngpháp đề xuất chứng minh toán học thực nghiệm với hệ thống đa bước tự động phát gai độngkinh đơn kênh sử dụng liệu thực 17 bệnh nhân bị độngkinh Các kết thực nghiệm cho thấy phươngpháp đề xuất đáng tin cậy Các nội dung liên quan chương cơng bố cơng trình [1, 2] danh mục cơng trình cơng bố 16 CHƯƠNG HỆ THỐNG ĐA BƯỚC PHÁT HIỆN GAI ĐỘNGKINH ĐA KÊNH DỰA TRÊN PHÂN TÍCH TEN-XƠ 3.1 Giới thiệu Hiện nay, hầu hết nghiên cứu để phát gai độngkinh tập trung vào phân tích tínhiệu EEG đơn kênh, tức tínhiệu EEG thu từ điện cực (kênh) Tuy nhiên, ghi điệnnão đồ thu tínhiệu từ nhiều kênh đồng thời, tạo thành tínhiệu EEG đa kênh Do dấu hiệuđộngkinh thường gây vùng tổn thương não nên số kênh gần thu dấu hiệuđộngkinh khoảng thời gian Do đó, phân tích đa kênh tăng hiệu việc phát gai độngkinh Do đó, luận án đặt vấn đề nghiên cứu hệ thống phân tích tínhiệu EEG đa kênh sử dụng phươngpháp phân tích ten-xơ để trích xuất đặc trưng gai độngkinh để phát gai độngkinh tự động 3.2 Hệ thống đa bước phát gai độngkinh đa kênh dựa phân tích ten-xơ Sơ đồ khối hệ thống đa bước phát gai độngkinh đa kênh dựa phân tích ten-xơ biểu diễn hình 3.1 gồm bước: biểu diễn liệu, trích xuất đặc trưng, lựa chọn đặc trưng phân loại 3.2.1 Biểu diễn liệu Bước biểu diễn liệu nhằm xây dựng ten-xơ độngkinh Xspike ten-xơ i không độngkinh Xnonspike Từ liệu bệnh nhân bị động kinh, N đoạn j liệu chứa gai độngkinh (mỗi đoạn liệu gồm I mẫu K kênh) sử dụng để xây dựng ten-xơ độngkinh chiều Xspike sử dụng phép biến đổi sóng liên i tục J tỉ lệ Kết thu N ten-xơ chiều có kích thước X P RIˆJˆK với ` ba chiều thời gian (I ), tỉ lệ (J ) kênh (K ) Các ten-xơ không độngkinh Xnonspike j xây dựng tương tự 17 Hình 3.1 Hệ thống phát gai độngkinh đa kênh 3.2.2 Trích xuất đặc trưng Mục tiêu bước trích xuất đặc trưng tìm khơng gian đặc trưng, Fspike chứa gai động kinh, sau đó, chiếu ten-xơ độngkinh ten-xơ không độngkinh lên khơng gian để trích xuất đặc trưng gai độngkinh gai không độngkinh 3.2.3 Lựa chọn đặc trưng Mục tiêu bước lựa chọn đặc trưng lựa chọn tập nhỏ đặc trưng tập lớn đặc trưng trích xuất sau bước trích xuất đặc trưng Luận án đề xuất phươngpháp lựa chọn đặc trưng mới, kết hợp phươngpháp lựa chọn đặc trưng dựa vào điểm Fisher trị số p cách sử dụng thuật tốn tìm chuỗi chung lớn 3.2.4 Phân loại Luận án sử dụng ba mơ hình phân loại thông dụng SVM, KNN NB 3.3 Mô đánh giá 3.3.1 Biểu diễn liệu Từ liệu 17 bệnh nhân, luận án sử dụng 1442 đoạn liệu, đoạn gồm 56 mẫu liệu EEG chứa gai động kinh, từ mẫu thứ i ´ 25 đến mẫu i ` 30 (i vị trí đỉnh gai động kinh, vị trí bác sĩ đánh dấu) để xây dựng ten-xơ động 18 , Tiếp theo, để xây dựng ten-xơ không độngkinh Xnonspike kinh chiều Xspike j i 6114 đoạn liệu lựa chọn ngẫu nhiên gồm 56 mẫu chứa gai không độngkinh Kết quả, luận án xây dựng tập gồm 1442 ten-xơ độngkinh (gọi lớp C1 ) 6114 ten-xơ không độngkinh (gọi lớp C2 ) Tập ten-xơ độngkinh ten-xơ không độngkinh chia thành 10 tập để thực xác thực chéo, tập gồm 144 ten-xơ độngkinh 611 ten-xơ khơng độngkinh 3.3.1.1 Trích xuất đặc trưng Hình 3.2 Ma trận A P R56ˆ15 thu từ phép phân tích Tucker với ràng buộc khơng ` âm ten-xơ độngkinh ten-xơ không độngkinh Sau xác định hạng ten-xơ (tức số thành phần để phân tích ten-xơ), tenr ep P R56ˆ20ˆ19ˆ1442 phân tích sử dụng phươngpháp phân tích xơ độngkinh X ` Tucker với ràng buộc không âm để thu ma trận hệ số A P R56ˆ15 , B P R20ˆ5 , ` ` C P R19ˆ19 (lớp C1 ) Tương tự vậy, thu ma trận ` mode thời gian, tỉ lệ kênh ten-xơ khơng độngkinh (lớp C2 ) Hình 3.2 biểu 19ˆ19 diễn đặc trưng lớp C1 lớp C2 Hình 3.3 biểu diễn ma trận C P R` ten-xơ độngkinh thu từ phép phân tích Tucker với ràng buộc không âm.Quan sát ma trận A ta thấy thành phần ten-xơ độngkinh định vị thời điểm định Trong đó, thành phần ten-xơ khơng độngkinh bị phân tán thời điểm khác nhau, ngoại trừ thành phần #9, #11 #12 Hơn nữa, ma trận C gai độngkinh định vị tốt số vùng đặc biệt đỉnh đầu 19 Hình 3.3 Ma trận C P R19ˆ19 thu từ phép phân tích Tucker với ràng buộc khơng ` âm ten-xơ độngkinh 3.3.1.2 Lựa chọn đặc trưng Tập đặc trưng đầu sau bước trích xuất đặc trưng bao gồm 1425 p15ˆ5ˆ19q đặc trưng Để lựa chọn tập đặc trưng tập 1425 đặc trưng cho chứa không gian liệu, luận án đề xuất phươngpháp kết hợp hai phươngpháp điểm Fisher trị số p Sau đó, hiệuphươngpháp đề xuất so sánh với phươngpháp lựa chọn đặc trưng thông dụng khác phươngpháp điểm Fisher, phươngpháp điểm Laplacian, phươngpháp lựa chọn đặc trưng phân biệt không giám sát (UDFS), phươngpháp lựa chọn đặc trưng ẩn không giới hạn (ILFS), phươngpháp lựa chọn đặc trưng để phân cụm dựa học địa phương (LLCFS) 3.3.1.3 Phân loại Để đánh giá khả phân biệt đặc trưng trích chọn, luận án sử dụng ba mơ hình phân loại đơn giản thông dụng k láng giềng gần (KNN), naive Bayes (NB), SVM.Chất lượng hệ thống trình bày bảng 3.1, 3.2 3.3 Bảng 3.1 biểu diễn ma trận đánh giá (SEN, SPE, AUC) hệ thống đa bước phát gai độngkinh đa kênh dựa phân tích ten-xơ sử dụng phân loại SVM thực xác thực chéo 10 lần Có thể thấy rằng, 10 trường hợp, ma trận đánh giá SEN, SPE AUC có kết phân loại tốt 20 Bảng 3.1 Xác thực chéo 10 lần, với phân loại SVM, sử dụng 100 đặc trưng có ý nghĩa Trường hợp Gai độngkinh 10 144 / 611 144 / 611 144 / 611 144 / 611 144 / 611 144 / 611 144 / 611 144 / 611 144 / 611 146 / 616 SEN SPE AUC 81.25% 96.73% 0.9579 81.94% 97.55% 0.9664 88.89% 93.94% 0.9594 80.56% 95.74% 0.9583 77.08% 97.22% 0.9588 81.25% 96.56% 0.9671 81.25% 96.73% 0.9657 83.33% 95.91% 0.9673 86.11% 96.73% 0.9707 86.30% 97.40% 0.9720 Trung bình: 82.80% 96.45% 0.9643 Bảng 3.2 Xếp chồng ten-xơ sử dụng phân loại SVM, KNN phân loại NB sử dụng 100 đặc trưng có ý nghĩa Ma trận đánh giá{Bộ phân loại SEN SPE AUC Phươngpháp luận án đề xuất SVM KNN NB 82.80% 82.80% 82.80% 96.45% 97.96% 84.66% 0.9643 0.8806 0.9024 Phươngpháp Phan-Cichocki đề xuất SVM KNN NB 76.24% 76.24% 76.24% 85.85% 87.09% 65.78% 0.8930 0.6991 0.8110 Bảng 3.3 So sánh phươngpháp phát gai độngkinh dựa phân tích ten-xơ sử dụng 100 đặc trưng lớn sử dụng phân loại SVM Metric SEN SPE AUC NTD TD 82.80% 54.75% 96.45% 90.47% 0.9643 0.8403 CP NCP 44.57% 90.98% 0.7679 77.38% 83.20% 0.8709 Bảng 3.2 minh họa so sánh phươngpháp phân tích ten-xơ luận án đề xuất phươngpháp đề xuất Phan Cichocki Rõ ràng, tất ma trận đánh giá ba phân loại huấn luyện với đặc trưng trích chọn có kết tốt từ 5% đến 20% so với phươngpháp Phan-Cichocki Bảng 3.3 biểu diễn kết so sánh phươngpháp luận án đề xuất phươngpháp dựa phân tích ten-xơ khác Chúng ta thấy rằng, phươngpháp dựa phân tích ten-xơ với ràng buộc khơng âm (tức là, phân tích Tucker với ràng buộc khơng âm phân tích CP với ràng buộc khơng âm) cho kết phân loại gai độngkinh gai khơng độngkinh với độ xác cao so với 21 phươngpháp khác Kết là, hai phươngpháp phân tích Tucker phân tích CP cho kết giá trị AUC thấp so với phươngpháp phân tích Tucker phân tích CP với ràng buộc không âm 3.4 Phươngpháp xấp xỉ hạng thấp đa tuyến tính đồng thời mở rộng cho cỏc ten-x I1 I2 ăăăIn , Bi toỏn SLMRAT: Cho tập gồm N ten-xơ bậc n, tXi uN i“1 , Xi P R r1 r2 ăăărn tỡm n ma trận chung tUk unk“1 , Uk P RIk ˆrk N ten-xơ lõi tGi uN i“1 , Gi P R cho Gi U1 U2 ă ă ă ˆn Un đưa xấp xỉ tốt ten-xơ Xi Luận án đề xuất thuật toán để giải phương trình (??), thuật tốn cho kết nghiệm tối ưu địa phương Algorithm 1: GSMLRAT: Xấp xỉ hạng thấp đa tuyến tính đồng thời mở rộng cho cỏc ten-x I1 I2 ăăăIn , hạng đa tuyến tính tr , r , , r u Input: N ten-xơ n-chiều tXi uN n i“1 , Xi P R n Output: Các ma trận chung tUk uk“1 , ten-xơ lõi tGi uN i“1 function Khởi tạo: Xây dựng ten-xơ xếp chồng pn ` 1q chiều X X1 X2 ă ă ă XN ; r pkq un mode ten-xơ sau Tính ma trận hiệp phương sai tR k“1 ř N T r pkq “ X X ; R i“1 i pkq i pkq p0q n r pkq khởi tạo cách chọn véc tơ riêng lớn R tU u k p0q k“1 Un`1 “ IN ; Phân tích Tucker (HOSVD, Tucker-ALS, NTD): p0q n`1 G, tUk un`1 k“1 “ decomposepX, tUk uk“1 q; Thu ten-xơ lõi: Gi “ Gp:, :, , iq 3.5 Kết luận chương Trong chương luận án trình bày hai nội dung chính, cụ thể sau: 1) Hệ thống đa bước phát gai độngkinh đa kênh sử dụng phân tích ten-xơ 2) Đưa tốn SMLRAT đề xuất thuật toán để giải toán SMLRAT, nội dung trình bày mục 3.4 Thuật tốn SMLRAT áp dụng để trích xuất đặc trưng gai độngkinh bước trích xuất đặc trưng hệ thống đa bước phát gai độngkinh đa kênh trình bày mục 3.2 Nội dung liên quan chương công bố cơng trình [3] [4] danh mục cơng trình khoa học tác giả liên quan đến luận án 22 KẾT LUẬN VÀ KIẾN NGHỊ Kết luận luận án Trong bệnhnãođộngkinh rối loạn phổ biến Hiện giới, loại bệnh tật bệnhđộngkinh chiếm 1% Việt Nam nước phát triển có số người bị bệnhđộngkinh cao, tình trạng tải bệnh viện thường xuyên xảy Vì vậy, thời gian làm xét nghiệm lâm sàng để chẩn đoánbệnh hạn chế, cụ thể thời gian đo điệnnão đồ ngắn, thường 10 phút (chuẩn quốc tế thời gian ngắn 20 phút), số lượng chuyên gia có kinh nghiệm thần kinh khơng nhiều dẫn đến tình trạng chẩn đốn nhầm bệnh hay xảy Vì việc xây dựng hệ thống phát gai độngkinh tự động, hỗtrợ cho chẩn đoánbệnhđộngkinh cần thiết ngày nhận nhiều quan tâm nhà nghiên cứu Luận án đặt vấn đề nghiên cứu sốphươngphápxửlýtínhiệuđiệnnãohỗtrợ chẩn đốn bệnhđộng kinh, qua q trình thực hiện, luận án giải thu số kết cụ thể sau: ‚ Đề xuất hệ thống đa bước phát gai độngkinh tự động đơn kênh Trong hệ thống này, luận án cải tiến cách chọn số lượng perceptron bước tiền xử lý, số lượng tỉ lệ biến đổi sóng bước trích xuất đặc trưng sử dụng hệ chuyên gia đơn giản để khai thác thông tin thời gian gai độngkinh gần Để đánh giá chất lượng hệ thống tự động phát gai độngkinh đơn kênh, luận án đề xuất phươngpháp ước lượng ROC tổng hợp cho hệ thống đa bước sử dụng nhiều ngưỡng định (các hệ thống phân loại xếp tầng) dựa hai phân bố, phân bố Gauss phân bố Logistic ‚ Xây dựng hệ thống đa bước phát gai độngkinh đa kênh dựa phân tích ten-xơ Trong hệ thống này, luận án đề xuất phươngpháp trích xuất đặc trưng với mục tiêu tìm không gian đặc trưng gai độngkinh để nhận biết gai 23 độngkinh Mặt khác, luận án đưa toán SMLRAT đề xuất thuật toán để giải tốn GSMLRAT Tính đắn thuật toán chứng minh toán học phần phụ lục luận án Thuật toán SMLRAT áp dụng để trích xuất đặc trưng gai độngkinh bước trích xuất đặc trưng hệ thống đa bước phát gai độngkinh đa kênh Phươngpháp trích chọn đặc trưng luận án sử dụng so sánh với cách trích chọn đặc trưng Phan Cichocki đề xuất [? ] Trong bước lựa chọn đặc trưng hệ thống, luận án kết hợp hai phươngphápphươngpháp điểm Fisher phươngpháp trị số p sử dụng thuật tốn tìm chuỗi chung lớn Như trình bày chương 3, kết cho thấy, phươngpháp lựa chọn đặc trưng hiệuso với phươngpháp lựa chọn đặc trưng khác phươngpháp điểm Fisher, điểm Laplacian, UDFS Hướng nghiên cứu Phươngphápxửlýtínhiệuhỗtrợ chẩn đốn bệnhđộngkinh nhận nhiều quan tâm nhà nghiên cứu Mộtsố hướng nghiên cứu phát triển luận án, là: 1) Định vị khu vực não bị tổn thương gây gai độngkinh 2) Xây dựng hệ thống đa bước phát gai độngkinh đơn kênh dựa phân tích ten-xơ 3) Nâng cao khả hệ chuyên gia, loại bỏ thêm giả gai độngkinhhiệu chỉnh lại gai đoán nhầm sử dụng phân tích ten-xơ 24 DANH MỤC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN [1] Nguyen Thi Anh-Dao, Nguyen Linh-Trung, Nguyen Van Ly, Tran Duc-Tan, Nguyen The Hoang Anh, and B Boashash, “A multistage system for automatic detection of epileptic spikes,” REV Journal on Electronics and Communications, vol 8, no 1–2, pp 1–13, 2018 [2] Le Trung Thanh, Nguyen Thi Anh Dao, Nguyen Linh-Trung, and Ha Vu Le, “On the overall ROC of multistage systems”, International Conference on Advanced Technologies for Communications (ATC), IEEE, 2017 p 229-234 [3] Nguyen Thi Anh-Dao, Le Trung Thanh, Nguyen Linh-Trung, Ha Vu Le, “Nonnegative Tensor Decomposition for EEG Epileptic Spike Detection”, NAFOSTED Conference on Information and Computer Science (NICS), 11/2018 [4] Le Trung Thanh, Nguyen Thi Anh-Dao, Viet-Dung Nguyen, Nguyen LinhTrung, and Karim Abed-Meraim, “Multi-channel EEG epileptic spike detection by a new method of tensor decomposition”, Journal of Neural Engineering (major revise) 25 ... vậy, để hỗ trợ cho bác sĩ việc chẩn đoán, phát bệnh động kinh giai đoạn bệnh nhẹ, tức xuất gai động kinh tín hiệu điện não đồ, luận án đặt vấn đề nghiên cứu số phương pháp xử lý tín hiệu để nhận... thiệu kiến thức điện não đồ, động kinh số dấu hiệu nhận biết động kinh dựa vào quan sát điện não đồ gai động kinh xung động kinh Sau đó, chương giới thiệu chuẩn đo điện não quốc tế 10 ´ 20, chuẩn. .. phát dạng động kinh tình trạng bệnh người bệnh 1.3 Gai động kinh Gai động kinh (epileptic spike) dạng động kinh bác sĩ sử dụng phổ biến chẩn đoán bệnh động kinh Thời gian tồn gai động kinh ngắn,