Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 102 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
102
Dung lượng
2,08 MB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Nghiên cứu phương pháp cải thiện độ xác chẩn đoán Tâm thần phân liệt dựa điện não đồ sử dụng học máy PHAN THỊ THU HIỀN Ngành: Kỹ thuật Y sinh Giảng viên hướng dẫn: TS Phạm Phúc Ngọc Viện: Điện tử - Viễn thông HÀ NỘI, 03/2021 TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Nghiên cứu phương pháp cải thiện độ xác chẩn đốn Tâm thần phân liệt dựa điện não đồ sử dụng học máy PHAN THỊ THU HIỀN Ngành: Kỹ thuật Y sinh Giảng viên hướng dẫn: TS Phạm Phúc Ngọc Viện: Điện tử - Viễn thơng HÀ NỘI, 03/2021 Chữ ký GVHD CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ tên tác giả luận văn: Phan Thị Thu Hiền Đề tài luận văn: Nghiên cứu phương pháp cải thiện độ xác chẩn đốn Tâm thần phân liệt dựa điện não đồ sử dụng học máy Chuyên ngành: Kỹ thuật Y sinh Mã số SV: CB190176 Tác giả, Người hướng dẫn khoa học Hội đồng chấm luận văn xác nhận tác giả sửa chữa, bổ sung luận văn theo biên họp Hội đồng ngày 15/04/2021 với nội dung sau: - Các thuật ngữ tiếng anh chuyển sang tiếng việt - Các lỗi chế - Cám ơn Học bổng Quỹ đổi sáng tạo (VINIF) - Tập đoàn Vingroup - Chỉnh sửa theo yêu cầu góp ý hội đồng Ngày 28 tháng 04 năm 2021 Giảng viên hướng dẫn CHỦ TỊCH HỘI ĐỒNG Tác giả luận văn LỜI CẢM ƠN Trong suốt trình học tập, nghiên cứu thực luận văn với đề tài “Nghiên cứu phương pháp cải thiện độ xác chẩn đoán Tâm thần phân liệt dựa điện não đồ sử dụng học máy”, nhận nhiều tình cảm, bảo Gia đình, nhà trường, thầy cô bạn bè tạo điều kiện cho tơi thực hồn thành đề tài Tôi xin chân thành cảm ơn TS Phạm Phúc Ngọc, giảng viên môn Công nghệ Điện tử & Kỹ thuật Y sinh, viện Điện tử - Viễn thông, trường Đại học Bách Khoa Hà Nội quan tâm hướng dẫn, giúp đỡ tận tâm tạo điều kiện thuận lợi cho tơi suốt q trình thực hồn thành luận văn Tơi xin chân thành cảm ơn Ban Giám hiệu, Phòng Đào tạo sau đại học Giảng viên Trường Đại học Bách Khoa Hà Nội truyền đạt kiến thức, góp ý chân thành, tạo điều kiện thuận lợi cho tơi suốt q trình học tập trình thực luận văn Tôi đặc biệt cảm ơn chân thành đến Quỹ đổi sáng tạo Vingroup (Vingroup Innovation Foundation – VinIF) trao cho học bổng, hỗ trợ cho tài để tơi dành tồn thời gian cho học tập nghiên cứu suốt trình học Thạc sỹ Cuối cùng, xin gửi tất lịng biết ơn đến gia đình, bố mẹ, Tập thể lớp cao học Kỹ thuật Y sinh 2019B anh chị em bạn bè, đồng nghiệp yêu thương, bên tôi, động viên tôi, tạo điều kiện tốt cho tơi để tơi hồn thành Chương trình đào tạo Thạc sỹ Bản thân tơi dù cố gắng, nỗ lực trình độ thời gian cịn hạn chế nên luận văn khơng tránh khỏi thiếu sót, kính mong nhận bảo, góp ý Thầy cô bạn để luận văn hồn thiện Một lần nữa, tơi xin trân trọng cảm ơn! Học viên Phan Thị Thu Hiền LỜI CAM ĐOAN Tôi xin cam đoan kết nêu luận văn tơi nhóm nghiên cứu thực chưa công bố tài liệu tạp chí chuyên ngành khác Trong đề tài có sử dụng sở liệu cơng cụ nghiên cứu thuộc nhóm nghiên cứu Lab 418 - Bộ môn CNĐT & Kỹ thuật Y sinh, Viện Điện tử Viễn thông, Trường Đại học Bách Khoa Hà Nội đồng ý, cho phép Giảng viên hướng dẫn TS Phạm Phúc Ngọc cho phép sử dụng phần kết cho đề tài nghiên cứu Học viên (Ký ghi rõ họ tên) Phan Thị Thu Hiền MỤC LỤC DANH MỤC HÌNH VẼ……………………………………………………… iv DANH MỤC BẢNG BIỂU…………………………………………………… vi DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT…………………………….…vii CHƯƠNG CƠ SỞ LÝ THUYẾT VỀ ĐIỆN NÃO ĐỒ 1.1 Lịch sử 1.2 Cơ sở sinh lý thần kinh điện não 1.2.1 Điện màng tế bào 1.2.2 Nguồn tín hiệu điện não 1.2.3 Đặc điểm dẫn truyền xung động thần kinh sợi trục 1.3 Kỹ thuật ghi điện não 1.3.1 Máy ghi điện não 1.3.2 Điện cực 1.3.3 Vị trí điện cực da đầu 1.3.4 Quy trình ghi điện não thường quy 10 1.3.5 Các nghiệm pháp hoạt hóa 11 1.3.6 Đánh giá ghi điện não 11 1.4 Các dạng sóng điện não (dựa vào tần số) 12 1.5 Nhiễu điện não đồ 16 1.6 Khác biệt theo vùng ghi điện não 17 1.7 Ưu nhược điểm điện não đồ 18 CHƯƠNG BỆNH TÂM THẦN PHÂN LIỆT VÀ ĐIỆN NÃO ĐỒ CỦA BỆNH NHÂN TÂM THẦN PHÂN LIỆT 21 2.1 Bệnh tâm thần phân liệt gì? 21 2.2 Triệu chứng bệnh 22 2.2.1 Các triệu chứng dương tính: 22 2.2.2 Các triệu chứng âm tính: 23 i 2.3 Nguyên nhân bệnh 24 2.3.1 Các yếu tố di truyền 24 2.3.2 Yếu tố môi trường 24 2.3.3 Căn nguyên sinh học thần kinh bệnh 25 2.4 Các thể lâm sàng bệnh tâm thần phân liệt 26 2.5 Các phương pháp chẩn đoán bệnh 28 2.5.1 Chẩn đoán xác định (theo ICD-10): có nhóm triệu chứng 28 2.5.2 Cận lâm sàng 29 2.6 Phương pháp điều trị phòng bệnh 29 2.7 Những bất thường EEG bệnh nhân Tâm thần phân liệt 30 CHƯƠNG HỆ THỐNG PHÁT HIỆN TÂM THẦN PHÂN LIỆT DỰA TRÊN ĐIỆN NÃO ĐỒ 33 3.1 Tiền xử lý tín hiệu điện não phương pháp ICA 34 3.2 Các đặc trưng điện não 38 3.2.1 Đặc trưng Entropy hoán vị 38 3.2.2 Các tham số Hjorth 43 3.3 Giảm chiều liệu phương pháp phân tích thành phần (PCA) 44 3.3.1 Cơ sở lý thuyết 44 3.3.2 Các bước thực PCA 47 3.3.3 Phương pháp xác định số thành phần 48 3.4 Các phân loại học máy 48 3.4.1 Decision Tree 49 3.4.2 K-Nearest Neighbor (k-NN) 53 3.4.3 Naïve Bayes 55 3.4.4 Support vector machine (SVM) 56 3.4.5 Bagging 67 3.4.6 Random forest 67 3.4.7 AdaBoost (Adaptive boosting) 68 ii 3.5 Dữ liệu validation liệu kiểm tra 69 3.6 Cách chọn siêu tham số cho mơ hình học máy 70 3.7 Các tham số đánh giá mơ hình 71 CHƯƠNG KẾT QUẢ NGHIÊN CỨU TỪ BỘ DỮ LIỆU “EEG IN SCHIZOPHRENIA” 73 4.1 Bộ liệu thực nghiệm 73 4.2 Tiền xử lý liệu điện não “EEG inschizophrenia” 74 4.3 Tính tốn đặc trưng cho liệu “EEG in schizophrenia” 77 4.3.1 Đặc trưng entropy hoán vị 78 4.3.2 Các đặc trưng Hjorth 78 4.4 Kết trình giảm chiều liệu 79 4.5 Kết phân loại bệnh nhân tâm thần phân liệt không tâm thần phân liệt 81 4.5.1 Các phân loại 81 4.5.2 Kết phát bệnh nhân TTPL sử dụng SVM kết hợp với grid search 83 TÀI LIỆU THAM KHẢO…………………………………………………… 87 iii DANH MỤC HÌNH VẼ Hình 1-1 Sự khuếch tán K+ Na+ Hình 1-2 Điện hoạt động tính thấm màng tế bào với ion Na+, K+ trình tạo điện hoạt động Hình 1-3 Cấu tạo nơron thần kinh Hình 1-4 Thiết bị ghi EEG xâm lấn khơng xâm lấn Hình 1-5 Sơ đồ khối hệ thống ghi EEG Hình 1-6 Hệ thống đặt điện cực ghi 10-20 Hình 1-7 Sóng đầu máy đo EEG sóng đầu vào xung cưa Đỉnh sóng nhọn chứng tỏ máy đủ độ nhạy để ghi sóng có tần số cao biên độ nhỏ; đoạn dốc xuống phải 2/3 tổng chiều cao 11 Hình 1-8 Các EEG hoạt động não 14 Hình 2-1 Vùng đồi thị não thất III rãnh não 25 Hình 2-2 Thể tích não giảm bệnh nhân tâm thần phân liệt 26 Hình 2-3 Mặt cắt đứng ngang (coronal) 1,5 mm đối chứng bình thường (bên trái) bệnh nhân tâm thần phân liệt (bên phải) 26 Hình 2-4 Các kết nối bất thường liên quan đến triệu chứng ảo giác bệnh nhân TTPL (hình ảnh bán cầu não trái) 31 Hình 2-5 Sự khác biệt hai thơng số Hjorth complexity Hjorth dimensional complexity bệnh nhân tâm thần phân liệt người khỏe mạnh 32 Hình 3-1 Mơ hình hệ thống phân loại tín hiệu điện não 33 Hình 3-2 Sơ đồ khối hệ thống phát tâm thần phân liệt 33 Hình 3-3 Sơ đồ khối bước lựa chọn phân loại cho hệ thống phát bệnh tâm thần phân liệt 34 Hình 3-4 Phổ tần tín hiệu y sinh 35 Hình 3-5 Biểu diễn liệu với hai hệ sở (e1, e2) (u1, u2) 46 Hình 3-6 Mơ tả thuật tốn Decision Tree 50 Hình 3-7 Ví dụ số lượng nearest neighbor ảnh hưởng tới kết phân loại 54 Hình 3-8 Các mẫu biểu diễn không gian R2 siêu phẳng phân tách hai nhóm (categories) 58 Hình 3-9 Đồ thị hàm số hàm sigmoid 60 Hình 3-10 Hàm giả định, trường hợp lấy ngưỡng 0.5 60 Hình 3-11 Đồ thị hàm số y = -log(x) 61 iv Hình 3-12 Phương pháp tìm điểm cực tiểu thuật tốn gradient descent 63 Hình 3-13 Các siêu phẳng phân loại lớp hình vng xanh lớp hình trịn đỏ 63 Hình 3-14 Margin hai classes lớn 64 Hình 3-15 Đường bao định phi tuyến 65 Hình 3-16 Cách thức hoạt động mơ hình bagging 67 Hình 3-17 Cách thức hoạt động mơ hình random forest 68 Hình 3-18 Cách thức hoạt động mơ hình Adaboost 68 Hình 3-19 Sơ đồ làm việc machine learning 69 Hình 3-20 Phân chia liệu thành tập training validation sử dụng k-fold cross validation 70 Hình 3-21 Chọn siêu tham số dựa grid search 70 Hình 4-1 Hệ thống điện cực EEG 10-20 tiêu chuẩn 73 Hình 4-2 Bản ghi điện não đồ người khỏe mạnh thứ 74 Hình 4-3 Phân tích tín hiệu 19 kênh điện não thành 19 thành phần độc lập 75 Hình 4-4 Phổ tần tín hiệu gốc 75 Hình 4-5 Phổ tần tín hiệu sau lọc 76 Hình 4-6 Loại bỏ nhiễu mắt ghi điện não đồ phương pháp phân tích thành phần độc lập 76 Hình 4-7 Giá trị Hjorth mobility điện cực, tính trung bình cho 429 mẫu khỏe mạnh 522 mẫu bệnh 78 Hình 4-8 Kết thực PCA với k từ đến 57, với k lớn 11 99% thơng tin ban đầu bảo toàn 79 Hình 4-9 Kết phân loại mơ hình SVM với liệu qua thực PCA với k từ đến 57 80 Hình 4-10 Kết phân loại mơ hình SVM với liệu qua thực PCA với k từ 15 đến 19 Các tham số accuracy f1 trung bình 30 lần thực huấn luyện với cách chia tập huấn luyện-kiểm tra khác 80 Hình 4-11 Phân bố tham số C 83 Hình 4-12 Giá trị C tìm qua grid search từ 30 mơ hình 85 Hình 4-13 Kết accuracy f1 score tập training testing với tham số C=5, kernel = ‘rbf’ với 30 tập training testing chia ngẫu nhiên 85 Hình 4-14 Quá trình chọn tham số cho phân loại phát bệnh nhân TTPL 86 v - Phổ tần tín hiệu sau lọc: Hình 4-5 Phổ tần tín hiệu sau lọc Hình 4-6 thể tín hiệu điện não theo thời gian Quan sát tín hiệu điện não trước lọc ICA sau lọc, đặc biệt hai điện cực Fp1 Fp2 (hai điện cực chịu ảnh hưởng nhiễu chớp mắt nhiều nhất) thấy sóng có biên độ lớn, tần số thấp tương ứng với nhiễu điện mắt bị loại bỏ Hình 4-6 Loại bỏ nhiễu mắt ghi điện não đồ phương pháp phân tích thành phần độc lập 76 Quan sát tín hiệu hai điện cực chịu ảnh hưởng nhiễu mắt nhiều Fp1 Fp2 thấy: thành phần tín hiệu nhiễu mắt (biên độ lớn: 10µV-2mV, tần số thấp: 0,1-10Hz) loại bỏ 4.3 Tính toán đặc trưng cho liệu “EEG in schizophrenia” Sau loại bỏ nhiễu phương pháp phân tích thành phần độc lập sử dụng công cụ EEGLAB, ghi tín hiệu điện não dài 15 phút cắt thành đoạn 30(s) Q trình phân đoạn tín hiệu thành mẫu 30 giây thực sau: mẫu dài 30 giây tương ứng với 30 × 250 = 7500 điểm liệu; bắt đầu lấy từ điểm liệu cuối – điểm thứ 231250 trở điểm thứ 223750 mẫu thứ nhất, từ điểm thứ 223749 trở điểm 216249 mẫu thứ hai, … tương tự khơng cịn đoạn đủ 7500 điểm liệu dừng lại Như vậy, mẫu tín hiệu ma trận kích thước 19×7500 Việc phân đoạn liệu từ điểm cuối trở trước nhằm mục đích hạn chế tín hiệu nhiễu giai đoạn đầu trình đo điện não, đối tượng chưa ổn định tư Bảng 4-1 Thống kê số lượng mẫu ghi điện não Bản ghi Số mẫu Bản ghi Số mẫu H01 30 S01 28 H02 30 S02 38 H03 30 S03 32 H04 30 S04 40 H05 31 S05 29 H06 31 S06 24 H07 30 S07 44 H08 30 S08 30 H09 30 S09 39 H10 37 S10 28 H11 30 S11 45 H12 30 S12 36 H13 32 S13 37 77 H14 28 S14 72 Tổng 429 Tổng 522 Tổng 429 + 522 = 951 Sau đó, đặc trưng tính cho mẫu tín hiệu 4.3.1 Đặc trưng entropy hốn vị Trong nghiên cứu này, mẫu tín hiệu ma trận kích thước 19× 7500, entropy hốn vị tính cho kênh điện não Input hàm tính entropy hốn vị vector gồm 7500 phần tử nên số phần tử chuỗi S m = 7500 Giả thiết chuỗi khơng có giá trị trùng khó xảy ra, nhiên số giá trị trùng 7500 điểm liệu Entropy hốn vị tính với thơng số: độ trễ 𝜏𝜏 = 1, số chiều D = 3, D = D = 4.3.2 Các đặc trưng Hjorth Đặc trưng Hjorth complexity Hjorth mobility liệu “EEG in schizophrenia” tính tốn biểu diễn hình 4-7 Giá trị đặc trưng Hjorth 522 mẫu liệu bệnh nhân kênh điện não tính trung bình cộng biểu diễn cột màu đỏ hình 4-7 Giá trị Hjorth 429 mẫu liệu người khỏe mạnh kênh điện não tính trung bình biểu diễn cột màu xanh dương Trên hình 4-7, trục hoành biểu diễn kênh điện não (19 kênh), trục tung mô tả giá trị Hjorth mobility vị người khỏe manh bệnh nhân Hình 4-7 Giá trị Hjorth mobility điện cực, tính trung bình cho 429 mẫu khỏe mạnh 522 mẫu bệnh 78 4.4 Kết trình giảm chiều liệu Theo cách chọn số principal components trình bày mục 3.2.3, số principal components chọn cho lượng thông tin hao hụt từ thông tin gốc so với thông tin sau PCA 1%, hay nói cách khác bảo tồn 99% thông tin ban đầu Thực giảm chiều giữ liệu phương pháp PCA cho liệu gồm 57 đặc trưng trích xuất từ tín hiệu EEG bệnh nhân TTPL đối chứng khỏe mạnh (19 kênh, kênh lấy đặc trưng: Hjorth mobility, Hjorth complexity, entropy hoán vị) cho thấy số principal components lớn 12 thơng tin bảo tồn 99% (Hình 4-8) Vậy số principal components k chọn lớn 12 Hình 4-8 Kết thực PCA với k từ đến 57, với k lớn 11 99% thơng tin ban đầu bảo toàn Khi tiến hành thực nghiệm với số k = 12, độ xác phân loại tập kiểm tra giảm so với khơng thực PCA Hình 4-9 cho thấy với k khoảng từ 15 đến 19 cho kết accuracy f1 score tập train tập kiểm tra cao, tăng k kết phân loại tập train cao tập kiểm tra giảm xuống, tượng over-fitting xảy Để chọn tham số k tốt cho toán phát bệnh nhân TTPL cần qua bước sau: - Thực PCA liệu 57 đặc trưng với k từ 15 đến 19, thu liệu 79 - Chọn phân lớp baseline (bộ phân lớp có performance cao, tham số mặc định) dùng chung cho tất liệu thu từ trình PCA với tất trường hợp k Hình 4-9 Kết phân loại mơ hình SVM với liệu qua thực PCA với k từ đến 57 Huấn luyện phân lớp sử dụng liệu tương ứng với giá trị k - Đánh giá kết mơ hình phân lớp k chọn theo tiêu chí: mơ hình tương ứng cho kết tốt k nhỏ Hình 4-10 Kết phân loại mơ hình SVM với liệu qua thực PCA với k từ 15 đến 19 Các tham số accuracy f1 trung bình 30 lần thực huấn luyện với cách chia tập huấn luyện-kiểm tra khác 80 Vì số mẫu liệu không lớn (nhỏ 1000 mẫu) nên kết phân loại tập kiểm tra bị ảnh hưởng lớn cách tạo tập train tập kiểm tra Vì vậy, để trình chọn k khách quan, thực quy trình 30 lần, kết accuracy f1 score tính kết trung bình qua 30 lần thực Hình 4-10 mơ tả tham số đánh giá mơ hình SVM với k từ 15 đến 19 Từ Hình 4-10, thấy k = 18 cho kết tốt tập train tập kiểm tra Vậy chọn k = 18 4.5 Kết phân loại bệnh nhân tâm thần phân liệt không tâm thần phân liệt 4.5.1 Các phân loại Kết phân loại bệnh nhân tâm thần phân liệt đối chứng khỏe mạnh trình bày Bảng 4-2, với hàng hàng cột Accuracy, Precision, Recall, F1 score, AUC tham số đo tập liệu huấn luyện kiểm tra liệu Bảng 4-2 Kết phân loại bệnh nhân tâm thần phân liệt đối chứng khỏe mạnh sử dụng mơ hình khác Tên mơ Tham số Accuracy Precision Recall hình KNN F1 AUC score K=3 100% 1.00 1.00 1.00 1.00 95% 0.95 0.95 0.95 0.994 Bagging 3- Weights = distance 100% 1.00 1.00 1.00 1.00 NN N_estimators = 49 98% 0.98 0.98 0.98 0.996 Bernoulli 74% 0.74 0.74 0.74 0.808 Naïve 72% 0.72 0.73 0.72 0.781 100% 1.00 1.00 1.00 1.00 90% 0.89 0.90 0.89 0.895 Bayes Decision Max_depth = 12 Tree Bagging Max_depth = 12 100% 1.00 1.00 1.00 1.00 decision N_estimators = 99 95% 0.95 0.95 9.95 0.981 tree 81 Random Max_depth = 12 100% 1.00 1.00 1.00 1.00 forest N_estimators = 99 94% 0.93 0.94 0.93 0.992 Gradient Learning rate 0.01 100% 1.00 1.00 1.00 1.00 Boosting N_estimators = 100 94% 0.94 0.93 0.93 0.982 AdaBoost Max_depth = 12 100% 1.00 1.00 1.00 1.00 N_estimators = 2000 90% 0.90 0.91 0.90 0.884 Kernel = rbf 100% 1.00 1.00 1.00 1.00 C = 10 98.7% 0.99 0.99 0.99 0.999 Learning rate = 0.5 SVM Các mơ hình cho kết phân loại khác tập liệu huấn luyện tập kiểm tra Cụ thể: - Mơ hình Nạve Bayes cho kết thấp tập liệu huấn luyện tập liệu kiểm tra (74% 72% độ xác) Tỷ lệ False Positive (FP) False Negative (FN) tương đương Việc mơ hình có khả phân loại khơng tốt giải thích việc giả sử đặc trưng liệu độc lập tuyến tính Điều khơng xảy đặc trưng trích xuất từ tín hiệu điện não đối tượng, đối tượng, tín hiệu EEG thu kênh đo có phụ thuộc với trình bày mục 1.6 - Mơ hình Decision Tree cho độ xác 90% tập kiểm tra, kết khơng tốt q trình huấn luyện, mơ hình tạo điều kiện so sánh (leaf), với tập liệu huấn luyện có kích thước nhỏ, giá trị ngưỡng dùng để so sánh khơng mang tính tổng qt, khiến cho liệu dễ bị phân loại nhầm mang đặc trưng dễ nhầm lẫn hai lớp - Mơ hình KNN có độ xác phân loại 95% tập liệu kiểm tra, nhãn liệu đưa vào gán dựa nhãn ba điểm liệu gần Phương pháp phù hợp với toán phát bệnh tâm thần 82 phân liệt, nhiên với trường hợp liệu bị nhiễu khó phân tách hai lớp kết dễ bị phân loại nhầm - Các mơ hình sử dụng học cộng đồng (ensemble learning) cho độ xác cải thiện khoảng 3% đến 5% so với base estimator - Mơ hình SVM cho độ xác phân loại cao nhất, thuật tốn có tảng toán học chặt chẽ, sử dụng kernel trick để biến liệu từ khơng thể phân tách tuyến tính dạng phân tách tuyến tính, từ cải thiện độ xác phân loại - Các phân loại có chênh lệch khơng lớn tham số precision recall liệu có đồng số lượng mẫu hai lớp Do đó, việc lựa chọn phân loại cần dựa độ xác phân loại Từ kết phân loại trình bày bảng tiêu chí chọn mơ hình phân loại, mơ hình SVM với siêu tham số kernel = rbf, C = 10 chọn làm phân loại cho toán phát bệnh nhân tâm thần phân liệt thể paranoid, với kết đánh giá tập kiểm tra liệu sau: - Accuracy: 98.7% - Precision: 0.99 - Recall: 0.99 - F1 score: 0.99 - AUC: 0.999 4.5.2 Kết phát bệnh nhân TTPL sử dụng SVM kết hợp với grid search Thực grid search kết hợp với 5-fold cross validation, với tham số thực search kernel C sau: - Kernel: linear, rbf, sigmoid - C (tham số regulalizer): tính theo hàm logspace thư viện numpy: C = np.logspace(0, 3, 50): 50 giá trị thuộc khoảng từ đến 1000, phân bố theo hàm log Hình 4-11 mơ tả phân bố tham số C Hình 4-11 Phân bố tham số C 83 Bảng 4-3 Kết grid search với giá trị C hàm kernel Kernel C Độ xác phân loại Linear 94.56 Sigmoid 94.58 Rbf 94.61 Linear 5.42 98.54 Sigmoid 5.42 98.63 Rbf 5.42 98.67 Linear 104.81 97.91 Sigmoid 104.81 97.95 Rbf 104.81 98.01 Linear 1000 96.23 Sigmoid 1000 96.35 Rbf 1000 97.01 Bảng 4-3 liệt kê kết thuật toán grid search với tổng số 50 giá trị C, kết hợp với hàm kernel Từ bảng trên, nhận xét hàm kernel rbf cho độ xác cao so với kernel linear sigmoid Giá trị C thuộc khoảng đến cho kết phân loại với độ xác cao C tiếp tục chọn cách tạo 30 mơ hình, mơ hình có cách chia tập train test khác Mỗi mơ hình cho qua grid search để tìm C tốt C chọn cuối trung bình 30 tham số C tìm 30 mơ hình Hình 4-12 mơ tả giá trị C tìm qua grid search từ 30 mơ hình: C dao động từ đến 16, C trung bình tính Kết phân loại bệnh nhân tâm thần phân liệt đối chứng khỏe mạnh trình bày Bảng 4-3, với hàng hàng cột Accuracy, Precision, Recall, F1 score tham số đo tập training data testing data 84 Hình 4-12 Giá trị C tìm qua grid search từ 30 mơ hình Hình 4-13 mơ tả kết accuracy f1 score tập training testing với tham số C=5, kernel = ‘rbf’ với 30 tập training testing chia ngẫu nhiên Ở tập tập training, accuracy f1 score xấp xỉ 1; tập testing, accuracy f1 score dao động khoảng 0.96 đến Trung bình accuracy tập testing 98,7%, trung bình f1-score tập testing 0.989 Hình 4-13 Kết accuracy f1 score tập training testing với tham số C=5, kernel = ‘rbf’ với 30 tập training testing chia ngẫu nhiên Từ kết phân loại trình bày trên, mơ hình SVM với hyperparameter kernel = rbf, C = chọn làm phân loại cho toán phát bệnh nhân tâm thần phân liệt thể paranoid, với kết đánh giá tập testing data sau: - Accuracy: 98.7% - F1 score: 0.989 85 Hình 4-14 mơ tả tóm tắt q trình lựa chọn tham số cho thuật tốn PCA mơ hình SVM phát bệnh nhân TTPL trình bày trên: - Từ liệu 57 đặc trưng, thực PCA với k từ đến 57 Chọn k > 12 để bảo tồn 99% thơng tin - Quan sát kết phân loại tập train tập test Chọn k từ 15 đến 19 để kết phân loại tốt, tránh chưa khớp khớp - Thực train-test split 30 lần để tạo 30 tập liệu khác nhau, áp dụng PCA với k từ 15 đến 19 cho tập Tính accuracy F1 score trung bình 30 lần để chọn k tốt Chọn k = 18 - Thực grid search với kernel = [‘linear’, ‘sigmoid’, ‘rbf’]; C = logspace(1, 3, 50) 30 cặp training data testing data khác Chọn kernel rbf, C = (trung bình cộng 30 giá trị C tìm qua grid search) - Thực train-test split 30 lần, dùng mơ hình SVM với tham số kernel C để tính accuracy F1 score trung bình tập test Đây kết mơ hình phân loại bệnh nhân TTPL với đối chứng khỏe mạnh Hình 4-14 Quá trình chọn tham số cho phân loại phát bệnh nhân TTPL 86 TÀI LIỆU THAM KHẢO [1] Trần Bách, Lưới điện hệ thống điện, Nhà xuất Khoa học Kỹ thuật, 2004 [2] Abe Masayuki, “A Practical Approach to Accurate Fault Location on Extra High Voltage Teed Feeders,” IEEE Transaction on Power Delivery, pp 159-168, 1995 [3] Microsoft, "Add citations in a Word document," 2017 [4] Phùng Trung Hùng, Phạm Thiên Tách, Nguyễn Phước Long, Lê Phi Hùng, "Giới thiệu số kênh ion tế bào" [5] [Online] Available: https://dinhnghia.vn/trinh-bay-cau-tao-cua-noron-than- kinh.html [6] R C Amlan Jyoti Bhagawati, "Design of Single Channel Portable EEG Signal Acquisition System for Brain Computer Interface Application," International Journal of Biomedical Engineering and Science (IJBES), 2016 [7] [Online] Available: https://instrumentationforum.com/t/electrode-10-20- system/5486 [8] [Online] Available: https://en.wikipedia.org/wiki/Electroencephalography [9] A Jablensky, "The diagnostic concept of schizophrenia: its history, evolution, and future prospects," Dialogues Clin Neurosci, 2010 [10] “Hướng dẫn chẩn đoán điều trị số rối loạn tâm thần thường gặp,” Bộ y tế, 2020 [11] "World Health Organization," October 2019 [Online] Available: https://www.who.int/news-room/fact-sheets/detail/schizophrenia [12] Marco M Picchioni, Robin M Murray, "Schizophrenia," PMCID, 2007 [13] "Tâm thần phân liệt," in Tâm thần học, Lê Đình Sáng, 2010 [14] Michael F.Egand, Thomas M Hyde, "Schizophrenia: Neurobiology," Kaplan & Sadock’s Comprehensive Textbook of Psychiatry, 2000 [15] PGS.Ts Phạm văn Mạnh, Ths Lê Sao Mai, "Bệnh tâm thần phân liệt," Hệ thống 87 thư viện số - Đại học Y Dược học Hải Phòng [16] Prof Michael J Owen, Prof Akira Sawa, Prof Preben B Mortensen, "Schizophrenia," HHS Public Access, 2016 [17] M E Shenton , C C Dickey, M Frumin, R W McCarley, "A review of MRI findings in schizophrenia," PubMed, 2001 [18] "Bệnh viện Quân y 103," Th Lò Mai Cam, 2015 [Online] Available: http://www.benhvien103.vn/vietnamese/bai-giang-chuyen-nganh/tam-than/tamthan-phan-liet/706/ [19] Paul C Fletcher, Chris D Frith, "Perceiving is believing: a Bayesian approach to explaining the positive symptoms of schizophrenia," Nature Reviews Neuroscience, 2009 [20] T Elbert 1, W Lutzenberger, B Rockstroh, P Berg, R Cohen, "Physical Aspects of the EEG in Schizophrenics," PubMed, 1992 [21] V.Jahmunah, ShuLih Oh, V.Rajinikanth, Edward J.Ciaccio, KangHao Cheong, N.Arunkumarh, U RajendraAcharya, "Automated detection of schizophrenia using nonlinear signal processing methods," Artificial Intelligence in Medicine, 2019 [22] J F X D L K Pynn, "The function of efference copy signals: implications for symptoms of schizophrenia," PubMed, 2013 [23] udith M Ford, Daniel H Mathalon, "Corollary discharge dysfunction in schizophrenia: can it explain auditory hallucinations?," PubMed, 2005 [24] Nash N Boutros, Cynthia Arfken, Silvana Galderisi, Joshua Warrick, Garrett Pratt, and William Iacono, "The Status of Spectral EEG Abnormality as a Diagnostic Test for Schizophrenia," PubMed Central, 2009 [25] PGS Hoàng Hà Kiệm, 09 08 2015 [Online] Available: http://hahoangkiem.com/can-lam-sang/hinh-anh-giai-phau-ctscan-so-nao359.html [26] E.Parvinnia,M.Sabetia, M.Zolghadri Jahromi, R.Boostani, "Classification of EEG Signals using adaptive weighted distance nearest neighbor algorithm," 88 ScienceDirect, 2013 [27] Kim JW, Lee YS, Han DH, Min KJ, Lee J, Lee K, "Diagnostic utility of quantitative EEG in un-medicated schizophrenia," Europe PMC, 2015 [28] Zack Dvey-Aharon ,Noa Fogelson,Avi Peled,Nathan Intrator, "Schizophrenia detection and classification by advanced analysis of EEG recordings using a single electrode approach," Plos One, 2015 [29] Jason K Johannesen, Jinbo Bi, Ruhua Jiang, Joshua G Kenney, Chi-Ming A Chen, "Machine learning identification of EEG features predicting working memory performance in schizophrenia and healthy adults," PubMed, 2016 [30] Lorenzo Santos-Mayo, Luis M San-Jose-Revuelta, Juan Ignacio Arribas, "A computer-aided diagnosis system with EEG based on the P3b wave during an auditory odd-ball task in schizophrenia," PubMed, 2017 [31] Antonio J Ibáđez-Molina, Vanessa Lozano,María F Soriano, José I Aznarte, Carlos J Gómez-Ariza, M T Bajo, "EEG multiscale complexity in schizophrenia during picture naming," Front Physiol, 2018 [32] Christ Devia, Rocio Mayol-Troncoso, Javiera Parrini, Gricel Orellana, Aida Ruiz, Pedro E Maldonado, Jose Ignacio Egana, "EEG Classification During Scene Free-Viewing for Schizophrenia Detection," IEEE Trans Neural Syst Rehabil Eng, 2019 [33] Shu Lih Oh, Jahmunah Vicnesh, Edward J Ciaccio, Rajamanickam Yuvaraj, U Rajendra Acharya, "Deep convolutional neural network model for automated diagnosis of schizophrenia using EEG signals," MDPI, 2019 [34] Ricardo Buettner; Michael Hirschmiller; Kevin Schlosser; Manfred Rössle; Marc Fernandes, "High-performance exclusion of schizophrenia using a novel machine learning method on EEG data," IEEE, 2019 [35] Ricardo Buettner, David Beil, Stefanie Scholtz, "Development of a Machine Learning Based Algorithm To Accurately Detect Schizophrenia based on Oneminute EEG Recordings," in HICSS-53 Proceedings: 53nd Hawaii International Conference on System Sciences, Maui, Hawaii, 2020 89 [36] [Online].Available: https://repod.icm.edu.pl/dataset.xhtml?persistentId=doi:10.18150/repod.0107441 [37] T Đ V Hùng, "Slide Mạch xủ lý tín hiệu y sinh," Viện điện tử viễn thông – đại học Bách khoa Hà Nội [38] N V H Nam, "Chuyên đề phân tích thành phần độc lập," đại học Bách khoa Hà Nội [39] "EEGLAB: an open source toolbox for analysis of single-trial EEG dynamics including independent component analysis," Arnaud Delorme - Scott Makeig,, 2014 [40] E.Parvinnia, M.Sabeti, M.Zolghadri Jahromi,nR.Boostan, "Classification of EEG Signals using adaptive weighted distance nearest neighbor algorithm," 2014 90 ...TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Nghiên cứu phương pháp cải thiện độ xác chẩn đoán Tâm thần phân liệt dựa điện não đồ sử dụng học máy PHAN THỊ THU HIỀN Ngành:... văn: Nghiên cứu phương pháp cải thiện độ xác chẩn đốn Tâm thần phân liệt dựa điện não đồ sử dụng học máy Chuyên ngành: Kỹ thuật Y sinh Mã số SV: CB190176 Tác giả, Người hướng dẫn khoa học Hội đồng... thần phân liệt, triệu chứng thể bệnh chính, bệnh sinh bệnh tâm thần phân liệt trình bày số bất thường não bệnh nhân tâm thần phân liệt, sở cho việc đề xuất chẩn đoán tâm thần phân liệt dựa điện não