1. Trang chủ
  2. » Tất cả

A decision support system for primary headache developed through machine learning

32 13 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 32
Dung lượng 449,41 KB

Nội dung

UNIVERSITY OF INFORMATION TECHNOLOGY INFORMATION SYSTEM

UNIVERSITY OF INFORMATION TECHNOLOGY INFORMATION SYSTEM -🙞🙜🕮🙞🙜 - A DECISION SUPPORT SYSTEM FOR PRIMARY HEADACHE DEVELOPED THROUGH MACHINE LEARNING Lớp: IS254.N11 GVHD: Nguyễn Hồ Duy Trí Thành viên: Trương Công Hưng 19521588 Trần Minh Quân 18521288 Phạm Thảo Nhi 19520815 Trịnh Linh Chi 19521285 Thành phố Hồ Chí Minh – 5/2022 LỜI CẢM ƠN Lời đầu tiên, chúng em xin cảm ơn thầy cô trường Đại học Công nghệ Thông tin Đại học Quốc gia Thành phố Hồ Chí Minh tạo điều kiện tốt cung cấp kiến thức cần thiết để hoàn thành môn đồ án hệ hỗ trợ định Chúng em xin gửi lời cảm ơn sâu sắc đến ThS Nguyễn Hồ Duy Trí, người hỗ trợ, hướng dẫn nhóm tạo điều kiện tốt để nhóm hoàn thành đề tài nghiên cứu Với hỗ trợ nhiệt tình cơ, cuối nhóm chúng em hồn thiện kiến thức cần thiết thơng qua việc nghiên cứu học hỏi kiến thức Chúng em vui nhận ý kiến đóng góp đề tài nhóm, chúng em cố gắng ngày hồn thiện tương lai tiếp tục học tập chăm để đạt kết tốt Cuối cùng, xin kính chúc thầy giảng ln có sức khỏe dồi dào, sống hạnh phúc, tiếp tục hoàn thành sứ mệnh cao truyền thụ tri thức cho hệ mai sau Xin chân thành cảm ơn q thầy cơ! Thành phố Hồ Chí Minh, tháng năm 2022 Nhóm sinh viên thực Trương Cơng Hưng Trần Minh Quân Phạm Thảo Nhi Trịnh Linh Chi NHẬN XÉT CỦA GVHD Mục lục CHAPTER 1: TỔNG QUAN ĐỀ TÀI 1.1 Giới thiệu 1.2 Mô tả toán CHAPTER 2: PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Thu thập liệu 2.2 Quy trình định, mô tả hệ thống hỗ trợ định 2.2.1 Thiết lập mơ hình phân loại (Discriminant Model Establishment) 2.2.2 Lựa chọn thuộc tính (Feature Selection) CHAPTER 3: KẾT QUẢ NGHIÊN CỨU 10 12 3.1 Đặc điểm bệnh nhân(Patient baseline characteristics) 12 3.2 Model building 12 3.3 Feature selection 14 CHAPTER 4: ĐÁNH GIÁ KẾT QUẢ 18 4.1 Model building 18 4.2 Feature selection 19 CHAPTER 5: TRIỂN KHAI MƠ HÌNH 21 5.1 Phân tích liệu phương pháp tiền xử lý 21 5.2 Phân tích kết 22 5.3 Kết luận 23 CHAPTER 6: KẾT LUẬN 24 BẢNG PHÂN CHIA CÔNG VIỆC 26 CHAPTER 7: 27 TÀI LIỆU THAM KHẢO CHAPTER 1: 1.1 TỔNG QUAN ĐỀ TÀI Giới thiệu Đau đầu triệu chứng thường gặp phòng khám chuyên khoa thần kinh Số liệu cho thấy năm 90% dân số nói chung bị đau đầu Ở Trung Quốc, tỷ lệ đau đầu nguyên phát năm báo cáo 23,8% Tỷ lệ đau nửa đầu 9,3% đau đầu căng thẳng 10,3% Do dân số đông, bệnh nhân chi 672,7 tỷ nhân dân tệ năm đau đầu nguyên phát, chiếm 2,24% GDP Trung Quốc Bệnh đau đầu khơng đe dọa nghiêm trọng đến tính mạng người bệnh lại ảnh hưởng nặng nề đến công việc chất lượng sống, khiến họ phải rút lui khỏi xã hội, đặt gánh nặng lên tâm, sinh lý người bệnh gia đình người bệnh kinh tế quốc gia Đau đầu chia thành đau đầu nguyên phát đau đầu thứ phát Có nhiều nguyên nhân gây đau đầu Do giống triệu chứng, bác sĩ đa khoa dễ bỏ sót chẩn đốn nhầm loại đau đầu Hơn nữa, Hiệp hội Đau đầu Quốc tế (IHS) đưa bảng phân loại đau đầu vào tháng năm 2018, Phân loại Quốc tế Rối loạn Đau đầu (ICHD-III) (Ủy ban Phân loại Đau đầu Hiệp hội Nhức đầu Quốc tế, 2018), liệt kê 200 biến thể đau đầu Sự phân loại phức tạp tạo nhiệm vụ khó khăn cho bác sĩ lâm sàng Việc Khơng có tiêu chuẩn vàng góp phần gây khó khăn cho việc chẩn đốn phân loại đau đầu Ngoài ra, lâu giới y khoa nhìn chung chưa quan tâm mức đến chứng đau đầu thực hành lâm sàng, trình độ thành thạo bác sĩ lâm sàng phân loại đau đầu khơng đồng Ví dụ, “đau đầu mạch máu” “đau đầu thần kinh” sử dụng để chẩn đốn đau đầu ngun phát Do đó, nhiều cải tiến cần thực việc tiêu chuẩn hóa cải thiện độ xác chẩn đoán lâm sàng đau đầu Theo báo cáo, đau đầu nguyên phát xảy thường xuyên so với đau đầu thứ phát tỷ lệ mắc chứng đau nửa đầu đau đầu căng thẳng đứng đầu số loại đau đầu nguyên phát Chứng đau nửa đầu bao gồm chứng đau nửa đầu có tiền triệu chứng chứng đau nửa đầu khơng có tiền triệu chứng Chứng đau nửa đầu khơng có tiền triệu chứng thường đau đầu bên, theo nhịp đập từ trung bình đến nặng; hoạt động thể chất hàng ngày làm trầm trọng thêm đau đầu chúng thường kèm với buồn nôn/nôn và/hoặc chứng sợ ánh sáng/sợ âm Tiền triệu chứng xuất triệu chứng thị giác, cảm giác hệ thống thần kinh trung ương khác trước đau đầu Nhức đầu căng thẳng loại đau đầu nguyên phát phổ biến nhất; đau đầu kiểu không thường xuyên thường kéo dài vài phút đến vài ngày Những đau đầu thường đặc trưng cảm giác chèn ép hai bên từ nhẹ đến trung bình; chúng khơng trầm trọng hoạt động thể chất hàng ngày thường không kèm với buồn nôn/nôn, chứng sợ ánh sáng/sợ âm Mặc dù có khác biệt lớn chứng đau nửa đầu điển hình chứng đau đầu căng thẳng, triệu chứng hầu hết bệnh nhân khơng điển hình, đặc biệt trường hợp đau đầu căng thẳng chứng đau nửa đầu khơng có tiền triệu chứng Vì vậy, thường khó để phân loại chúng Do có nhiều khác biệt việc điều trị hai chứng rối loạn, việc chẩn đốn sai bỏ sót chẩn đốn chắn làm chậm q trình điều trị thích hợp cho bệnh nhân (Porter et al., 2019) Phần mềm máy tính chất lượng cao hữu ích để nhận biết xác đau đầu Ngay từ năm 2013, Krawczyk et al (2013) đề xuất chẩn đốn tự động chứng đau đầu ngun phát thơng qua học máy So sánh hiệu suất chẩn đốn cơng nghệ máy học tiên tiến bác sĩ lâm sàng cho thấy hệ thống hỗ trợ định máy tính đạt độ xác chẩn đốn cao Gần hơn, Vandewiele et al (2018) đề xuất hệ thống hỗ trợ định từ đầu đến cuối để cải thiện hiệu chẩn đoán theo dõi điều trị đau đầu nguyên phát Hệ thống hỗ trợ định bao gồm ba thành phần lớn chương trình phụ trợ chia sẻ: ứng dụng di động dành cho bệnh nhân, ứng dụng web dành cho bác sĩ để trực quan hóa liệu thu thập mơ-đun chẩn đốn tự động Trong mơ-đun chẩn đốn tự động, định sử dụng để lập mơ hình (Vandewiele et al., 2018) Xiangyong (2019) đề xuất hệ thống định đau đầu dựa tiêu chuẩn chẩn đốn đau đầu quốc tế tiến hành đánh giá lâm sàng tháng Trung tâm Đau đầu Quốc tế bệnh viện đại học Bắc Kinh Kết tốt độ nhạy độ đặc hiệu hệ thống để chẩn đoán chứng đau đầu ghi nhận (Xiangyong, 2019) Xem xét quy tắc ngơn ngữ khơng hồn chỉnh chun gia chia sẻ kiến thức họ, Khayamnia et al (2019) cải tiến thuật toán sử dụng thuật toán Learning-From-Examples (LEF) để huấn luyện hệ mờ chẩn đoán tỷ lệ nhận dạng đạt 85% Họ tiếp tục đề xuất hệ thống hỗ trợ định dựa SVM - perceptron đa lớp (MLP), đạt tỷ lệ xác 90% 88% (Khayamnia et al., 2019) Simi'c et al (2021) tạo hệ thống thơng minh kết hợp để chẩn đốn chứng rối loạn đau đầu nguyên phát, áp dụng kỹ thuật tốn học, thống kê trí tuệ nhân tạo khác Mặc dù loại hình nghiên cứu khác dành cho hệ thống hỗ trợ định máy tính, cịn trở ngại lớn việc sử dụng rộng rãi chúng thực hành lâm sàng Học máy áp dụng cho hồ sơ y tế cơng cụ hiệu để dự đốn bệnh tật Ở Trung Quốc, phương pháp học máy để chẩn đoán chứng đau đầu ngun phát cịn nhiều thiếu sót Vì vậy, để đạt độ xác chẩn đốn đau đầu cao hơn, nhóm tác giả thu thập thông tin từ bệnh nhân đau đầu nguyên phát phịng khám thần kinh thơng qua bảng câu hỏi sau nhập liệu vào hệ thống Nhóm tác giả so sánh thuật tốn học máy khác để xác định mơ hình tốt Hơn nữa, thơng qua lựa chọn đặc điểm, nhóm tác giả xác định yếu tố quan trọng để phân loại chứng đau nửa đầu với chứng đau đầu căng thẳng, tạo sở cho bác sĩ lâm sàng chẩn đoán nhanh chứng đau đầu 1.2 Mơ tả tốn Chẩn đốn xác loại đau đầu thử thách lớn thường không xác, phương pháp chẩn đốn đau đầu trọng tâm nghiên cứu chuyên sâu Do đó, tác giả giới thiệu vấn đề chẩn đốn đau đầu ngun phát trình bày cách phân loại Vấn đề xem xét triển khai thành hệ thống sử dụng máy học để hỗ trợ định lâm sàng cho chứng đau đầu nguyên phát Các thí nghiệm, thực tập liệu tác giả thu thập, xác nhận hệ thống hỗ trợ định máy tính đạt độ xác nhận dạng cao cơng cụ hữu ích thực hành hàng ngày bác sĩ Đây điểm khởi đầu cho nghiên cứu tương lai tự động hóa chẩn đốn đau đầu nguyên phát ⮚ Dữ liệu nhân học đặc điểm đau đầu 173 bệnh nhân thu thập bảng câu hỏi ⮚ Decision Tree, Random Forest, Logistic Regression, SVM Gradient Boosting sử dụng để xây dựng mơ hình phân loại ⮚ Ma trận nhầm lẫn (confusion matrix) sử dụng để tính tốn số đánh giá mơ hình ⮚ Thực lựa chọn tính thơng qua phân tích thống kê đơn biến học máy CHAPTER 2: PHƯƠNG PHÁP NGHIÊN CỨU Đây nghiên cứu cắt ngang thiết kế để có mơ hình phân loại chẩn đoán cho chứng đau nửa đầu đau đầu kiểu căng thẳng để sàng lọc yếu tố quan trọng để phân loại hai loại Nghiên cứu phê duyệt Ủy ban Đạo đức Bệnh viện Nhân dân số trực thuộc Đại học Y khoa Giao thông Thượng Hải (phê duyệt số SH9H-2021-T721) đáp ứng yêu cầu Tuyên bố Helsinki Những bệnh nhân đủ điều kiện bệnh nhân chẩn đoán mắc chứng đau đầu khoảng thời gian từ tháng 10 năm 2019 đến tháng năm 2020 Khoa Thần kinh, Bệnh viện Nhân dân số Thượng Hải Tất bệnh nhân cư dân Trung Quốc Trước nghiên cứu, nhóm tác giả nhận đồng ý có chữ ký bệnh nhân tham gia Hai tuần sau bảng câu hỏi bệnh nhân thu thập, tác giả theo dõi cải thiện tình trạng đau đầu bệnh nhân để xác minh thêm chẩn đốn Cuối cùng, nhóm tác giả đưa 173 bệnh nhân chẩn đoán xác định đau đầu nguyên phát (84 bệnh nhân đau nửa đầu 89 bệnh nhân đau đầu kiểu căng thẳng) để nghiên cứu 2.1 Thu thập liệu Đầu tiên, nhóm tác giả thiết kế bảng câu hỏi để bệnh nhân ngoại trú hoàn thành Bảng câu hỏi bao gồm tổng cộng 19 câu hỏi để thu thập liệu nhân học (tuổi, giới tính, nghề nghiệp, chiều cao cân nặng) bệnh nhân đặc điểm đau đầu họ (tiến trình, thời gian, tính chất, vị trí, cường độ nghiêm trọng, triệu chứng kèm theo, yếu tố khởi phát, cách giảm nhẹ, liệu hoạt động có làm nặng thêm đau đầu hay không) Sau phân tích sửa đổi bảng câu hỏi ba nhà thần kinh học có kinh nghiệm, bảng câu hỏi coi hiệu để thu thập thông tin liên quan đến bệnh nhân liệu thu đáng tin cậy mức độ định Hơn nữa, thông tin kiểm tra liên quan MRI sử dụng để loại trừ yếu tố phụ bệnh nhân Ba nhà thần kinh học mời để chẩn đoán cho bệnh nhân dựa thơng tin bảng câu hỏi mà nhóm tác giả thu thập Dựa kết chẩn đoán theo dõi, bệnh nhân chẩn đoán xác Do tỷ lệ thấp đau đầu nguyên phát đau dây thần kinh đau đầu cụm thấp số quan sát thu thập, nhóm tác giả loại trừ loại đau đầu gặp để giảm vấn đề cân mẫu Cuối cùng, 173 bệnh nhân (84 bệnh nhân bị chứng đau nửa đầu 89 bệnh nhân bị đau đầu căng thẳng) đưa vào nghiên cứu (Hình 1) Mỗi đau đầu bệnh nhân có nhiều tính chất kèm theo nhiều triệu chứng Do đó, nhóm tác giả thực phân loại nhị phân liệu thu thập thu tổng cộng 48 biến Xem xét tỷ lệ xảy nhiều biến thấp, trước tiên nhóm tác giả xác định 10 biến có khác biệt đáng kể mặt thống kê chứng đau nửa đầu đau đầu căng thẳng Sau chuyển đổi liệu giảm liệu, bảng liệu sử dụng để thu thập liệu trình vấn lâm sàng trình bày Bảng Hình 1: Lưu đồ nghiên cứu Thuộc tính Migraine Tension-type (n = 84) headache (n = 89) Total P-value Giới tính/n(%) – – – – Nữ 20(23.8) 39(43.8) 59(34.1) P = 0.01 Nam 64(76.2) 50(56.2) 114(65.9)   Thời gian mắc bệnh/n(%) Gradient boosting 0.70 0.79 0.86 0.79 0.7 0.82 Logistic 0.88 0.77 0.87 0.84 regression SVM-linear 0.8 0.90 0.82 0.75 0.81 0.82 0.8 0.82 Bảng 2: Đánh giá hiệu phân loại mơ hình khác 3.3 Feature selection Để lựa chọn tính năng, nhóm tác giả áp dụng hai phương pháp: phân tích thống kê đơn biến machine learning Đối với kiểm định đơn biến, sử dụng PCC (Hình 2) kiểm định chi-square (Bảng 3) để so sánh đặc điểm hai nhóm xếp hạng chúng theo giá trị p Thông qua kiểm tra chi-square đơn biến, Nhóm tác giả xác định giá trị p nhỏ thu cho biến cho biết liệu đau đầu có kèm theo buồn nơn / nơn hay khơng liệu đau đầu có kèm theo chứng sợ ánh sáng / tiếng ồn không Hai biến có ý nghĩa lớn việc phân loại hai rối loạn PCC xác nhận mối tương quan chặt chẽ yếu tố hai danh sách Tỷ lệ chênh lệch (ORs) cho buồn nôn / nôn sợ ánh sáng / tiếng ồn 0,4 cao so với biến số gây đau đầu khác Thơng qua phân tích tương quan đơn giản, Nhóm tác giả quan sát thấy bệnh nhân buồn nôn / nôn mửa sợ ánh sáng / tiếng ồn có nhiều khả chẩn đốn đau nửa đầu đau đầu kiểu căng thẳng Để xác nhận khám phá mối quan hệ sâu sắc hai rối loạn, Nhóm tác giả thu bảng xếp hạng tầm quan trọng đặc điểm thông qua random forest model (Bảng 4) Trong số biến, buồn nôn / nôn sợ ánh sáng / tiếng ồn có giá trị quan trọng 0,1897 0,1573, xếp chúng hai biến hàng đầu Để xác minh 14 khả dự đoán buồn nôn / nôn chứng sợ ánh sáng / tiếng ồn, Nhóm tác giả đào tạo hồi quy logistic hai đặc điểm này, với độ xác trung bình đạt 0,74 diện tích trung bình đường cong ROC đạt 0,74 (Bảng 5) Hình 2: Hệ số tương quan Pearson(PCC) Characteristic variable P-value Photophobia/phonophobia P < 0.001 Nausea/vomiting P < 0.001 Course P < 0.001 Change after activities P < 0.001 15 Severe intensity P < 0.001 Alleviative way P = 0.00 Occiput P = 0.00 Throbbing P = 0.01 Spark P = 0.02 Bảng 3: Chi-square test Biến đặc trưng Tầm quan trọng Nausea/vomiting 0.1897 Photophobia/phonophobia 0.1573 Change after activities 0.1144 Course 0.1124 Severe intensity 0.1083 Alleviative way 0.0837 Occiput 0.0754 Spark 0.0604 16 ... quan Pearson(PCC) Characteristic variable P-value Photophobia/phonophobia P < 0.001 Nausea/vomiting P < 0.001 Course P < 0.001 Change after activities P < 0.001 15 Severe intensity P < 0.001 Alleviative... so với đau đầu thứ phát tỷ lệ mắc chứng đau n? ?a đầu đau đầu căng thẳng đứng đầu số loại đau đầu nguyên phát Chứng đau n? ?a đầu bao gồm chứng đau n? ?a đầu có tiền triệu chứng chứng đau n? ?a đầu khơng... chứng đau đầu ghi nhận (Xiangyong, 2019) Xem xét quy tắc ngôn ngữ không hoàn chỉnh chuyên gia chia sẻ kiến thức họ, Khayamnia et al (2019) cải tiến thuật toán sử dụng thuật toán Learning- From-Examples

Ngày đăng: 05/02/2023, 14:55

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN