Nghiên cứu và ứng dụng kỹ thuật phân nhóm xây dựng hệ thống dự đoán bệnh tự kỷ ở trẻ em

27 287 0
Nghiên cứu và ứng dụng kỹ thuật phân nhóm xây dựng hệ thống dự đoán bệnh tự kỷ ở trẻ em

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Header Page of 145 ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN THỊ THƢƠNG NGHIÊN CỨU VÀ ỨNG DỤNG KỸ THUẬT PHÂN NHÓM XÂY DỰNG HỆ THỐNG DỰ ĐOÁN BỆNH TỰ KỶ Ở TRẺ EM Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 Khóa: K30 TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Đà Nẵng - Năm 2017 Footer Page of 145 Header Page of 145 Công trình hoàn thành TRƯỜNG ĐẠI HỌC BÁCH KHOA Người hướng dẫn khoa học: TS NGUYỄN VĂN HIỆU Phản biện 1: PGS.TS Nguyễn Tấn Khôi Phản biện 2: PGS.TS Lê Mạnh Thạnh Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Khoa học máy tính họp Trường Đại học Bách khoa vào ngày 08 tháng 01 năm 2017 Có thể tìm hiểu luận văn tại:  Trung tâm Học liệu, Đại học Đà Nẵng  Thư viện Khoa Công nghệ thông tin, Trường Đại học Bách khoa - ĐHĐN Footer Page of 145 Header Page of 145 MỞ ĐẦU Lí chọn đề tài Theo số liệu thống kê từ Khoa phục hồi Chức thuộc Bệnh viện Nhi Trung ương số trẻ em mắc bệnh tự kỷ không ngừng tăng lên bệnh tự kỷ dường nỗi lo lắng lớn gia đình Việt Hơn nữa, Việt Nam có hệ thống chẩn đoán trẻ tự kỷ, gần có phần mềm A365 để sàng lọc chậm phát triển can thiệp sớm cho trẻ tự kỷ nhà nhóm tiến sĩ Vũ Song Hà phát triển Vì cần xây dựng ứng dụng mang ý nghĩa thực tiễn, giúp bậc làm cha/ mẹ tự kiểm tra sơ để phát sớm dấu hiệu bệnh Với mong muốn góp phần phát triển phương pháp luận phục vụ việc dự đoán bệnh tự kỷ trẻ em, giúp bậc cha mẹ, thầy cô giáo, y bác sĩ phát bệnh sớm nhằm nâng cao hiệu điều trị bệnh, chọn đề tài “Nghiên cứu ứng dụng kỹ thuật phân nhóm xây dựng hệ thống dự đoán bệnh tự kỷ trẻ em” làm đề tài tốt nghiệp Mục tiêu nhiệm vụ nghiên cứu 2.1 Mục tiêu nghiên cứu Nghiên cứu, cải tiến kỹ thuật phân nhóm để vận dụng xây dựng hệ thống hỗ trợ dự đoán bệnh tự kỷ trẻ em 2.2 Nhiệm vụ nghiên cứu - Tìm hiểu dấu hiệu nhận biết bệnh tự kỷ trẻ em; - Tìm hiểu kỹ thuật phân nhóm; - Xây dựng hệ thống hỗ trợ dự đoán bệnh tự kỷ trẻ em Footer Page of 145 Header Page of 145 Đối tƣợng phạm vi nghiên cứu 3.1 Đối tƣợng nghiên cứu Hệ thống chẩn đoán bệnh tiền tự kỷ trẻ Phương pháp phân nhóm liệu Phương pháp hỗ trợ chẩn đoán 3.2 Phạm vi nghiên cứu Phương pháp hỗ trợ chẩn đoán tiền tự kỷ trẻ sở phương pháp phân nhóm liệu Ứng dụng phương pháp để xây dựng hệ thống hỗ trợ chẩn đoán tiền tự kỷ trẻ Phƣơng pháp nghiên cứu 4.1 Phƣơng pháp lý thuyết 4.2 Phƣơng pháp thực nghiệm Ý nghĩa khoa học thực tiễn đề tài 5.1 Ý nghĩa khoa học Nghiên cứu, tìm hiểu kĩ thuật phân nhóm liệu để phục vụ công việc chẩn đoán 5.2 Ý nghĩa thực tiễn Xây dựng ứng dụng mang ý nghĩa nhân văn thực tiễn giúp bậc làm cha/mẹ phát sớm tự kỷ trẻ Bố cục luận văn Nội dung luận văn gồm nội dung sau đây: Chƣơng Trình bày kiến thức bệnh tự kỷ trẻ em Chƣơng Giới thiệu tổng quan kỷ thuật phân nhóm, ưu nhược điểm kỷ thuật phân nhóm Footer Page of 145 Header Page of 145 Chƣơng Trình bày quy trình ứng dụng kỷ thuật phân nhóm chẩn đoán bệnh tự kỷ Tập trung phân tích yêu cầu hệ thống, xác định chức chính, xây dựng sơ đồ hoạt động ứng dụng, tiến hành cài đặt ứng dụng CHƢƠNG TỔNG QUAN VỀ HỘI CHỨNG TỰ KỶ Ở TRẺ EM Nội dung chương giới thiệu kiến thức bệnh tự kỷ trẻ em, nguyên nhân gây bệnh, triệu chứng bệnh, dấu hiệu nhận biết tác hại bệnh tự kỷ 1.1 KHÁI NIỆM VỀ BỆNH TỰ KỶ 1.1.1 Giới thiệu bệnh tự kỷ Ngay từ đầu kỷ 19 có báo cáo trường hợp đơn lẻ trẻ bé mắc bệnh rối loạn tâm trí nặng có liên quan đến biến dạng rõ trình phát triển Maudsley (năm 1876) nhà tâm bệnh học ý đến nghiên cứu trạng thái Năm 1978, Hiệp hội Quốc gia Bệnh tự kỷ Hoa Kỳ đưa định nghĩa: Tự kỷ hội chứng hành vi biểu trước 30 tháng tuổi Còn DSM III (1980) DSM III-R (1987) Hội tâm thần học Hoa Kỳ, tự kỷ trẻ em loại rối loạn phát triển lan tỏa (PDD – Pervasive Developmental Disorders) 1.1.2 Khái niệm bệnh tự kỷ Tự kỷ loại khuyết tật phát triển suốt đời thể Footer Page of 145 Header Page of 145 vòng ba năm đầu đời Tự kỷ rối loạn hệ thần kinh gây ảnh hưởng đến hoạt động não Tự kỷ xảy cá nhân nào, không phân biệt giới tính, chủng tộc, giàu nghèo địa vị xã hội Tự kỷ biểu khiếm khuyết tương tác xã hội; khó khăn giao tiếp ngôn ngữ phi ngôn ngữ; khiếm khuyết hành vi, sở thích hoạt động mang tính hạn hẹp lặp lặp lại1 Bệnh tự kỷ trẻ em thường khó phát hiện, phát bệnh nặng khó chữa 1.2 NGUYÊN NHÂN CỦA BỆNH TỰ KỶ 1.2.1 Yếu tố môi trƣờng 1.2.2 Yếu tố di truyền 1.2.3 Yếu tố tâm lý thần kinh 1.2.4 Yếu tố hoá chất 1.3 TRIỆU CHỨNG ĐẶC TRƢNG CỦA BỆNH TỰ KỶ 1.3.1 Tự kỷ trầm cảm Tự kỷ trầm cảm hai bệnh phổ biến nhiều người nhầm lẫn hai bệnh với Tự kỷ trầm cảm chứng bệnh sợ hãi độ, ảnh hưởng đến hành vi, suy nghĩ giao tiếp người Bệnh nhân mắc chứng bệnh thường ngại giao tiếp, ngại tụ tập nơi đông người, có xu hướng thích - Bệnh tự kỷ: - Bệnh trầm cảm: Trích dịch từ chuyên trang Liên hiệp quốc tự kỷ http://www un org/en/events/autismday/background shtml Footer Page of 145 Header Page of 145 1.3.2 Triệu chứng lâm sàng Mỗi trẻ tự kỷ có biểu khác nhau, hai trẻ tự kỷ hoàn toàn giống triệu chứng hay mức độ nặng nhẹ bệnh Những dấu hiệu vấn đề hành vi thường gặp trẻ tự kỷ a Dấu hiệu cảnh báo tuổi - Giai đoạn từ – tháng tuổi: Trẻ bị tự kỷ giai đoạn thường có biểu hiện: Không phản ứng với âm tiếng gọi mẹ, tiếng xúc sắc trò chơi Không tập trung ánh mắt vào người nói chuyện, tương tác hỏi chuyện Bé có biểu tăng động quấy khóc nhiều, khó dỗ dành bé “hiền”, thờ yên lặng, không đòi chăm sóc - Giai đoạn từ – 12 tháng tuổi: Không ý đến hoạt động người xung quanh, trẻ bình thường lúc biết theo mẹ, giữ mẹ thích có bạn chơi cùng; phát âm không phát âm; chơi mình, sử dụng đồ vật cách bất thường gãi, cào hay cọ xát, chơi với ngón tay tay trước mặt; không vẫy tay chào, tạm biệt, tay hay biểu hành động tương tự b Dấu hiệu cảnh báo tuổi - Khiếm khuyết quan hệ xã hội: - Khiếm khuyết khả bắt chước - Khiếm khuyết khả đáp ứng tình cảm: - Khiếm khuyết động tác thể - Khiếm khuyết sử dụng đồ vật: - Khiếm khuyết khả thích nghi với thay đổi: - Khiếm khuyết phản ứng thị giác: Footer Page of 145 Header Page of 145 - Khiếm khuyết phản ứng thính giác: - Khiếm khuyết phản ứng vị giác, khứu giác, xúc giác: - Khiếm khuyết cảm giác sợ hãi hồi hộp: - Khiếm khuyết giao tiếp lời: - Khiếm khuyết giao tiếp không lời: - Khiếm khuyết mức độ hoạt động: - Khiếm khuyết đáp ứng trí tuệ: 1.4 KẾT CHƢƠNG CHƢƠNG CÁC KỸ THUẬT PHÂN NHÓM DỮ LIỆU 2.1 TỔNG QUAN VỀ KỸ THUẬT PHÂN NHÓM 2.1.1 Phân lớp liệu Phân lớp dự đoán hai dạng phân tích liệu nhằm trích rút mô hình mô tả lớp liệu quan trọng hay dự đoán xu hướng liệu tương lai Quá trình phân lớp liệu gồm hai bước : Bƣớc 1: Học (giai đoạn huấn luyện) Bƣớc 2: Phân lớp Phân lớp liệu/đối tượng độ xác phân lớp đánh giá chấp nhận Cần sử dụng tập liệu kiểm tra độc lập với tập liệu đào tạo Dưới kỹ thuật phân lớp sử dụng: - Phân lớp với định - Phân lớp với mạng Bayesian Footer Page of 145 Header Page of 145 - Phân lớp với mạng Neural - Phân lớp với k phần tử gần (k-nearest neighbor) - Phân lớp dựa tình (case-based reasoning) - Phân lớp dựa tiến hoá gen (genetic algorithms) - Phân lớp với lý thuyết tập thô (rough sets) - Phân lớp với lý thuyết tập mờ (fuzzy sets) … 2.1.2 Các vấn đề liên quan đến phân lớp liệu - Chuẩn bị liệu cho việc phân lớp - Đánh giá mô hình phân lớp 2.1.3 Các phƣơng pháp đánh giá độ xác mô hình phân lớp Có phương pháp đánh giá phổ biến holdout k-fold cross-validation Cả kỹ thuật dựa phân hoạch ngẫu nhiên tập liệu ban đầu 2.2 THUẬT TOÁN ID3 Thuật toán ID3 (Iterative Dichotomiser 3) thuật toán dùng để xây dựng định trình bày John Ross Quinlan 2.2.1 Tiêu chí chọn thuộc tính Thuật toán dùng độ đo độ lợi thông tin IG để xác định điểm chia Xét bảng định DT = (U, C  {d}), số giá trị (nhãn lớp) d k Khi Entropy tập đối tượng DT định nghĩa bởi: k Entropy (U )   pi log pi (2.1) i 1 Trong pi tỉ lệ đối tượng DT mang nhãn lớp i Footer Page of 145 Header Page 10 of 145 Độ lợi thông tin IG lượng Entropy lại tập đối tượng DT phân hoạch theo thuộc tính điều kiện c IG xác định theo công thức sau: | Uv | Entropy (U v ) vVc | U | IG(U , c)  Entropy (U )   (2.2) Trong Vc tập giá trị thuộc tính c, Uv tập đối tượng DT có giá trị thuộc tính c v 2.2.2 Thuật toán ID3 2.2.3 Đánh giá thuật toán ID3 2.3 THUẬT TOÁN C4.5 2.3.1 Tiêu chí chọn thuộc tính Thuật toán C4.5 cải tiến từ thuật toán ID3 với việc cho phép xử lý tập liệu có thuộc tính số (numeric atributes) làm việc với tập liệu bị thiếu bị nhiễu Gain Ratio đại lượng để đánh giá độ hiệu thuộc tính dùng để thực phép tách thuật toán để phát triển định: Gain( X , T ) GainRatio( X , T )  SplitInfo( X , T ) (2.3) Với: SplitInfo( X , T )   | Ti | |T | log i |T | iValue ( X ) | T |  (2.4) Trong đó: - Value (X) tập giá trị thuộc tính X - Ti tập tập T ứng với thuộc tính X có giá trị vi Thuộc tính lựa chọn để phân lớp thuộc tính có giá trị Gain Ratio lớn Footer Page 10 of 145 Header Page 13 of 145 11 toán C4.5 Giai đoạn 1.2: Tính entropy, Information Gain Gain Ratio thuộc tính phương trình (2.1) (2.2) (2.3) Giai đoạn 1.3: Xử lý liệu đầu vào dựa thuật toán cụ thể C4.5 Giai đoạn 1.4: Đánh giá mô hình, độ xác tính toán sử dụng kỹ thuật kiểm chứng chéo k lần, tỉ lệ lỗi, kích thước cây, thời gian thực cho trình Giai đoạn thứ hai thuật toán mC4.5 bao gồm: Giai đoạn 2.1: Lựa chọn mẫu dùng giai đoạn đầu Giai đoạn 2.2: Rời rạc hóa tất thuộc tính liên tục tập liệu Giai đoạn 2.3: Xử lý liệu đầu vào theo thuật toán mC4.5 Giai đoạn 2.4: Đánh giá mô hình, độ xác tính toán sử dụng kỹ thuật kiểm chứng chéo k lần, tỉ lệ lỗi, kích thước cây, thời gian thực cho trình 2.5.3 Đánh giá thuật toán mC4.5 Các kết thực nghiệm cho thấy biện pháp sử dụng Average Gain nhanh so với sử dụng độ đo Gain Ratio kích thước thời gian đào tạo, đồng thời trì độ xác phân lớp cao 2.6 CẢI TIẾN THUẬT TOÁN CÂY QUYẾT ĐỊNH DỰA TRÊN THUẬT TOÁN DI TRUYỀN Cây định nhận luật tối ưu thuật toán di truyền thường dùng làm công cụ để tối ưu Vì Footer Page 13 of 145 Header Page 14 of 145 12 dùng thuật toán di truyền để tối ưu kết định 2.6.1 Mã hóa cho luật Nói chung thuật toán di truyền thông qua bit mã hóa với độ dài cố định; phổ biến sử dụng mã nhị phân Trong phương pháp này, độ dài nhiễm sắc thể cố định, độ dài luật thay đổi, tạo luật đơn giản 2.6.2 Hàm thích nghi cho luật Trong thuật toán di truyền, hàm thích nghi độ đo đánh giá tính tốt hay xấu cá thể Hàm thích nghi xây dựng theo công thức sau: Max fitness = a x simplicity + b x support + c x accuracy + d x Gain Ratio (2.11) Khi a, b, c, d trọng số biến đoạn [0,1] a + b + c + d =1 2.6.3 Phép toán lai ghép đột biến cho luật Lai ghép hai điểm sử dụng nhiễm sắc thể phương pháp Tạo số thực ngẫu nhiên Sm đoạn [0,1] Nếu Sm nhỏ xác suất đột biến Pm, ta đột biến cá thể Mỗi đột biến phép toán đột biến phối hợp phép toán đột biến 2.6.4 Thuật toán cải tiến Bước 1: Khởi tạo quần thể tập mẫu R với S ghi lựa chọn ngẫu nhiên từ tập liệu đào tạo có thuộc tính phân lớp với giá trị Ci Sau tiến hóa đại số biến thích nghi trung bình (avg) Footer Page 14 of 145 Header Page 15 of 145 13 quần thể khởi tạo gán Bước 2: Tiền xử lý hoạt động tạo dựa mẫu R bao gồm làm liệu, rời rạc hóa thuộc tính liên tục, tính toán Gain Ratio thuộc tính đặc trưng mã hóa ghi liệu Cuối có quần thể ban đầu mã hóa P(r) Bước 3: Tính toán độ thích nghi cá thể quần thể sau độ thích nghi trung bình tìm Bước 4: Nếu giá trị số phát triển quần thể tối đa avgi  avgi 1   lặp lại bước 5,6,7 Nếu không chuyển qua bước Bước 5: Tính toán độ thích nghi trung bình hệ lựa chọn này, lai ghép đột biến tiến hành quần thể Vì quần thể tạo Bước 6: Thay cá thể có độ thích nghi thấp tập bố mẹ cá thể có độ thích nghi cao quần thể Bước 7: Tính toán độ thích nghi cá thể hệ mới, độ thích nghi trung bình tốt Bước 8: Những cá thể có độ thích nghi thấp ngưỡng thích nghi thấp loại Quần thể tối ưu tập luật tối ưu Thuật toán: Cây định _thuật toán di truyền Dữ liệu vào: Tập liệu khởi tạo R, tham số cho thuật toán di truyền Dữ liệu ra: Luật phân lớp tối ưu Begin I = 0; Initialize P(I); Footer Page 15 of 145 Header Page 16 of 145 14 //khởi tạo quần thể; Duyệt tập R, lựa chọn ghi có giá trị thuộc tính phân lớp Ci Preprocessing R; //quy trình bao gồm: làm liệu, rời rạc thuộc tính liên tục, tính toán Information Gain thuộc tính, mã hóa ghi liệu nhận quần thể khởi tạo Fitness P(I); Avg(Fitness P(I)); While (I ɛ ) { I ++; GA_Operation P(I); Fitness P(I); } Hoặc xóa cá thể có độ thích nghi thấp giá trị ngưỡng; Tối ưu quần thể P(I); //nhận luật phân lớp tối ưu tính hàm thích nghi trung bình Finess(I) END 2.6.5 Đánh giá thuật toán - Thuật toán đề xuất cải thiện so với thuật toán định bình thường độ xác Như kết bảng 4.14 cho thấy thuật toán cải tiến dựa thuật toán di truyền có độ xác cao thuật toán C4.5 - Các luật tối ưu dễ dàng hiểu so với thuật toán khác Footer Page 16 of 145 Header Page 17 of 145 15 2.7 KẾT CHƢƠNG Chương trình bày nội dung sau: - Kỹ thuật phân nhóm ưu nhược điểm kỹ thuật phân nhóm - Các thuật toán phân nhóm đánh giá thuật toán Chương trình bày quy trình ứng dụng kỹ thuật phân nhóm chẩn đoán bệnh tự kỷ trẻ em CHƢƠNG ỨNG DỤNG KỸ THUẬT PHÂN NHÓM VÀO CHẨN ĐOÁN BỆNH TỰ KỶ Ở TRẺ EM Nội dung chương trình bày quy trình ứng dụng kỹ thuật phân nhóm chẩn đoán bệnh tự kỷ, biến đổi triệu chứng bệnh thành thuộc tính liệu vào kết luận bệnh thành thuộc tính liệu 3.1 QUY TRÌNH CHẨN ĐOÁN BỆNH TỰ KỶ 3.1.1 Phân loại bệnh tự kỷ a Phân loại theo mức độ b Phân loại theo ngôn ngữ c Phân loại theo số thông minh - P1: Trẻ không bị tự kỷ - P2: Trẻ bị tự kỷ mức độ nhẹ - P3: Trẻ bị tự kỷ mức độ trung bình - P4: Trẻ bị tự kỷ 3.1.2 Quy trình chẩn đoán bệnh Bƣớc 1: Giai đoạn khám lâm sàng Bƣớc 2: Giai đoạn khám cận lâm sàng Footer Page 17 of 145 Header Page 18 of 145 16 3.2 QUY TRÌNH ỨNG DỤNG VÀO CHẨN ĐOÁN BỆNH TỰ KỶ Hệ thống chẩn đoán bệnh tự kỷ kỹ thuật phân nhóm thực theo quy trình sau: Bước Thu thập liệu Bước Xây dựng định Bước Xây dựng luật tối ưu Bước Ứng dụng luật chẩn đoán bệnh 3.2.1 Thu thập liệu 3.2.2 Xây dựng định Trong khuôn khổ luận văn, định xây dựng theo thuật toán cải tiến mC4.5 thuật toán di truyền trình bày chương Dữ liệu vào thuật toán mô tả sau: a Dữ liệu vào Các triệu chứng bệnh tự kỷ chuyển thành thuộc tính áp dụng thuật toán, bảng liệu mẫu chứa liệu với thuộc tính sau: - Thuộc tính A (Quan hệ xã hội) - Thuộc tính B (Khả bắt chước) - Thuộc tính C (Đáp ứng tình cảm) - Thuộc tính D (Các động tác thể) - Thuộc tính E (Sử dụng đồ vật) - Thuộc tính F (Thích nghi với thay đổi) - Thuộc tính G (Phản ứng thị giác) - Thuộc tính H (Phản ứng thính giác) Footer Page 18 of 145 Header Page 19 of 145 17 - Thuộc tính I (Phản ứng qua vị, khứu, xúc giác khả sử dụng giác quan này) - Thuộc tính J (Sợ hãi hồi hộp) - Thuộc tính K (Giao tiếp lời) - Thuộc tính L (Giao tiếp không lời) - Thuộc tính M (Mức độ hoạt động) - Thuộc tính N (Đáp ứng trí tuệ) b Dữ liệu Đầu thuật toán xây dựng định để phân lớp theo mức độ tự kỷ: P1, P2, P3, P4 (Xem mục 3.1.1.) 3.2.3 Xây dựng luật Từ định xây dựng luật dạng IFTHEN Mỗi luật đường từ nút gốc đến nút Luật có dạng sau: IF R1 and R2 and … and Rn THEN Kết = G Sau có luật ta tiến hành tối ưu tập luật theo phương pháp đề xuất chương 3.2.4 Ứng dụng luật chẩn đoán bệnh Hệ thống sử dụng luật tối ưu vào chẩn đoán bệnh tự kỷ Người sử dụng cung cấp cho hệ thống thông tin liên quan đến bệnh nhân là: thông tin quan hệ xã hội, khả bắt chước, đáp ứng tình cảm, động tác thể, sử dụng đồ vật,… hệ thống suy diễn dựa vào tập luật tạo cho kết nguy mắc bệnh ứng với thông tin cung cấp Các kết chẩn đoán bệnh trường hợp: P1, P2, P3, P4 tương ứng với kết luận trẻ không bị tự kỷ, trẻ bị tự kỷ mức độ nhẹ, trẻ bị tự kỷ mức độ trung bình trẻ bị tự kỷ Footer Page 19 of 145 Header Page 20 of 145 18 3.3 PHÂN TÍCH THIẾT KẾ HỆ THỐNG 3.3.1 Xác định yêu cầu Hệ thống chẩn đoán bệnh tự kỷ cho phép cập nhật thông tin người dùng, cập nhật triệu chứng bệnh nhân theo ngày hỗ trợ cho việc chẩn đoán bệnh tự kỷ Các tác nhân tham gia hệ thống: Quản trị viên, người sử dụng (phụ huynh) a Yêu cầu chức Đối với quản trị viên: Đăng nhập, đăng xuất, quản lý thông tin cá nhân người dùng, quản lý danh sách trẻ, quản lý hồ sơ bệnh án trẻ, quản lý liệu tập huấn, quản lý luật Đối với người sử dụng: - Đăng ký tài khoản - Đăng nhập - Đăng xuất - Cập nhật thông tin cá nhân - Cập nhật thông tin trẻ có liên quan (thêm, sửa, xóa) - Cập nhật hoạt động hàng ngày trẻ (thêm, sửa, xóa) - Cập nhật thông tin liên quan đến việc chẩn đoán bệnh trẻ - Chẩn đoán bệnh b Yêu cầu phi chức - Thiết kế giao diện thân thiện, dễ sử dụng - Quản lý liệu hợp lý - Đầy đủ chức theo yêu cầu 3.3.2 Biểu đồ triển khai hệ thống Footer Page 20 of 145 Header Page 21 of 145 19 3.3.3 Biểu đồ ca sử dụng a Ca sử dụng đăng nhập b Ca sử dụng thêm hoạt động hàng ngày trẻ c Ca sử dụng Import liệu mẫu từ file excel d Ca sử dụng sinh luật tự động e Ca sử dụng chẩn đoán bệnh 3.3.4 Biểu đồ hoạt động a Hoạt động đăng nhập b Hoạt động cập nhật hoạt động hàng ngày trẻ c Hoạt động quản lý liệu mẫu quản lý luật d Hoạt động chẩn đoán bệnh 3.3.5 Biểu đồ a Đăng nhập b Sinh luật c Chẩn đoán 3.4 XÂY DỰNG CƠ SỞ DỮ LIỆU 3.4.1 Phân tích sở liệu Để xây dựng hệ thống với chức trên, sở liệu cần có bảng quan hệ sau: Bảng 4.6 Các bảng liệu quan hệ STT Tên bảng USERACCOUNT CHILD DAILY EXP SYM LAW SYMDATA Footer Page 21 of 145 Mô tả Lưu thông tin tài khoản Lưu thông tin trẻ Lưu cập nhật ngày trẻ Bảng chi tiết triệu chứng Lưu thông tin triệu chứng Lưu luật chẩn đoán Lưu liệu mẫu Header Page 22 of 145 20 3.4.2 Xây dựng bảng liệu 3.4.3 Quan hệ bảng 3.5 XÂY DỰNG CHƢƠNG TRÌNH Tác giả phát triển ứng dụng theo hướng trở thành website Các bước tiến hành cài đặt chương trình: - Cài đặt server tomcat cho host, deloy trang web để tạo file war - Upload file.war lên host để thực cài đặt trang web server tomcat Giao diện số sau: - Màn hình đăng nhập: - Màn hình quản lý liệu mẫu - Màn hình tạo luật Hình 4.14 Màn hình tạo luật Footer Page 22 of 145 Header Page 23 of 145 21 - Màn hình chẩn đoán bệnh Hình 4.15 Màn hình chẩn đoán bệnh 3.6 ĐÁNH GIÁ KẾT QUẢ Chương trình bày nội dung sau: Quy trình ứng dụng kỹ thuật phân nhóm chẩn đoán bệnh tự kỷ trẻ em, biến đổi triệu chứng bệnh thành thuộc tính liệu vào kết luận bệnh thành thuộc tính liệu kỷ thuật phân nhóm, quy trình xây dựng hệ thống hỗ trợ dự đoán bệnh tự kỷ trẻ em Để chứng minh hiệu phương pháp đề xuất tác giả tiến hành cài đặt hai thuật toán thuật toán mC4.5 thuật toán cải tiến dựa thuật toán di truyền để áp dụng vào phân nhóm mức độ trẻ tự kỷ Với tập liệu mẫu có kích thước 508 ghi gồm 14 thuộc tính đặc trưng thuộc tính phân lớp thể phụ lục 3, thuật toán mC45 sinh 37 luật, thuật toán cải tiến Footer Page 23 of 145 Header Page 24 of 145 22 dựa thuật toán di truyền sinh 30 luật trình bày phụ lục phụ lục Sau tiến hành thực đánh giá độ xác mô hình phân lớp phương pháp k-fold cross validation với k 10 ta có kết bảng 4.14 Bảng 4.14 So sánh độ xác thuật toán mC4.5 thuật toán di truyền Algorithm Accuracy mC4.5 97% Di truyền 98% Các kết thực nghiệm cho thấy biện pháp sử dụng Average gain thuật toán cải tiến mC4.5 trì độ xác phân lớp cao Thuật toán đề xuất dựa thuật toán di truyền cải thiện so với thuật toán định mC4.5 độ xác Về bản, chương trình đạt mục tiêu đề xây dựng thành công công cụ hỗ trợ chẩn đoán bệnh tự kỷ trẻ em, giải pháp có khả ứng dụng cao thực tế Tuy vậy, liệu mẫu chủ yếu tác giả sưu tầm vào tổng hợp qua Internet Để tăng độ xác hệ thống chẩn đoán, cần bổ sung nhiều liệu mẫu lấy từ bác sĩ, chuyên gia tâm lý lĩnh vực nghiên cứu tự kỷ trẻ em Footer Page 24 of 145 Header Page 25 of 145 23 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN KẾT LUẬN Chẩn đoán để phát sớm bệnh tự kỷ trẻ em việc làm cần thiết để có biện pháp điều trị kịp thời phù hợp Hiện nay, việc hội chẩn hội chứng tự kỷ nên có tham gia chuyên gia nhiều lĩnh vực khác nhau: tâm lý, tâm thần, giáo dục, âm ngữ trị liệu, vật lý trị liệu Yếu tố trình chẩn đoán tìm hiểu chung trình phát triển trẻ (ghi nhận dấu hiệu phụ huynh cho "đáng ngại", khám lâm sàng thể chất trí tuệ) Với mục tiêu cải tiến kỹ thuật phân nhóm để vận dụng xây dựng hệ thống hỗ trợ dự đoán bệnh tự kỷ trẻ em, tác giả hoàn thiện luận văn với kết đạt sau: - Trình bày kiến thức hội chứng tự kỷ trẻ em; xây dựng quy trình chẩn đoán - Giới thiệu tổng quan phương pháp phân nhóm liệu Trình bày cụ thể thuật toán ID3, C4.5, Sprint, hai thuật toán cải tiến mC4.5 thuật toán dựa thuật toán di truyền - Cài đặt thành công hai thuật toán xây dựng định mC4.5 thuật toán dựa thuật toán di truyền - Xây dựng trang Web hỗ trợ lưu trữ thông tin trẻ, lưu trữ liệu tập huấn, luật ứng dụng chẩn đoán trẻ tự kỷ - Khi ca bệnh chẩn đoán thành công thêm vào nguồn liệu tập huấn, làm tăng tính xác trình chẩn đoán Tuy nhiên hạn chế mặt thời gian kiến thức nên luận văn Footer Page 25 of 145 Header Page 26 of 145 24 tồn số thiếu sót mà tác giả phải tiếp tục nghiên cứu, tìm hiểu là: - Nguồn liệu mẫu chủ yếu thu thập mạng internet, cần bổ sung thêm nguồn liệu mẫu từ chuyên gia uy tín lĩnh vực bệnh tự kỷ trẻ em - Mới cài đặt hai thuật toán mC4.5 thuật toán dựa thuật toán di truyền tập liệu đầy đủ rời rạc, chưa cài đặt thuật toán liệu liên tục, không đầy đủ HƢỚNG PHÁT TRIỂN CỦA ĐỀ TÀI Luận văn thực mục tiêu ban đầu đặt xây dựng thành công hệ thống hỗ trợ chẩn đoán bệnh tự kỷ, nhiên nhiều hạn chế Về lý thuyết: - Nghiên cứu phương pháp phân nhóm liệu hệ thống thông tin không đầy đủ, liệu liên tục không chắn Về thực nghiệm: - Cần bổ sung thêm liệu tập huấn để mô hình định có độ tin cậy cao hoạt động hiệu - Hỗ trợ việc liên kết với bác sĩ, nhà tâm lý học bệnh tự kỷ để tăng thêm tính chuẩn xác trình chẩn đoán bệnh - Tìm hiểu nhu cầu thực tế để từ cải tiến chương trình, cài đặt lại toán theo thuật toán nghiên cứu để làm việc tốt với sở liệu lớn Footer Page 26 of 145 Header Page 27 of 145 Footer Page 27 of 145 ... nghiệp Mục tiêu nhiệm vụ nghiên cứu 2.1 Mục tiêu nghiên cứu Nghiên cứu, cải tiến kỹ thuật phân nhóm để vận dụng xây dựng hệ thống hỗ trợ dự đoán bệnh tự kỷ trẻ em 2.2 Nhiệm vụ nghiên cứu - Tìm hiểu... tự kỷ trẻ em; - Tìm hiểu kỹ thuật phân nhóm; - Xây dựng hệ thống hỗ trợ dự đoán bệnh tự kỷ trẻ em Footer Page of 145 Header Page of 145 Đối tƣợng phạm vi nghiên cứu 3.1 Đối tƣợng nghiên cứu... thuật phân lớp sử dụng: - Phân lớp với định - Phân lớp với mạng Bayesian Footer Page of 145 Header Page of 145 - Phân lớp với mạng Neural - Phân lớp với k phần tử gần (k-nearest neighbor) - Phân

Ngày đăng: 22/04/2017, 00:41

Từ khóa liên quan

Mục lục

  • 1GA.pdf

    • content-3

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan