Nghiên cứu và ứng dụng kỹ thuật cây quyết định xây dựng hệ thống dự đoán bệnh tự kỷ ở trẻ em

26 93 2
Nghiên cứu và ứng dụng kỹ thuật cây quyết định xây dựng hệ thống dự đoán bệnh tự kỷ ở trẻ em

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG ĐỖ THỊ THU HÀ NGHIÊN CỨU VÀ ỨNG DỤNG KỸ THUẬT CÂY QUYẾT ĐỊNH XÂY DỰNG HỆ THỐNG DỰ ĐOÁN BỆNH TỰ KỶ Ở TRẺ EM Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 TĨM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng – Năm 2015 Cơng trình hoàn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: TS Nguyễn Văn Hiệu Phản biện 1: TS Huỳnh Hữu Hưng Phản biện 2: TS Trần Thiên Thành Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Khoa học máy tính họp Đại học Đà Nẵng vào ngày 18 tháng năm 2015 Có thể tìm hiểu luận văn tại:  Trung tâm Thông tin-Học liệu, Đại học Đà Nẵng  Thư viện trường Đại học Bách Khoa, Đại học Đà Nẵng MỞ ĐẦU Tính cấp thiết đề tài Bệnh tự kỷ hội chứng rối loạn phức tạp trình phát triển tự nhiên người Trẻ em mắc bệnh tự kỷ có nhiều biểu khiếm khuyết quan hệ xã hội, khiếm khuyết sử dụng ngôn ngữ giao tiếp, khiếm khuyến hành vi, thường chơi tưởng tượng,… Hiện nay, bệnh tự kỷ trẻ em trở thành mối quan tâm, lo ngại toàn xã hội Nhiều chuyên gia giới nhận định tỷ lệ trẻ bị tự kỷ ngày gia tăng Theo số liệu Bộ Lao động Thương binh Xã hội, Việt Nam có khoảng 5% - 7% trẻ em có khuyết tật độ tuổi 15 trở xuống, đó, trẻ tự kỷ bại não chiếm 40% Bệnh viện Châm cứu trung ương thống kê năm khoảng 3.000 lượt trẻ có vấn đề não tự kỷ đến điều trị Theo thống kê bệnh viện Nhi Đồng năm 2012 có đến 2.563 lượt trẻ tự kỷ đến khám Ở Việt Nam chưa có nghiên cứu điều tra, thống kê thức trẻ tự kỷ Nếu ước lượng theo tỷ lệ nước Anh Việt Nam có khoảng 200.000 người tự kỷ Có nhiều nguyên nhân khiến trẻ mắc bệnh tự kỷ đưa ra, nguyên nhân gây bệnh chưa hiểu biết đầy đủ Bệnh tự kỷ chưa có thuốc chữa, chưa có phác đồ điều trị cụ thể, biểu bệnh trẻ khác Phát sớm điều có ý nghĩa quan trọng cho việc trị liệu trẻ mắc chứng tự kỷ Nếu trẻ tự kỷ phát hiện, chẩn đoán sớm can thiệp cách bản, tồn diện, hợp lý kiên trì trước 40 tháng tuổi trẻ tiến tốt Khi phát can thiệp sớm, trẻ khắc phục khiếm khuyết trợ giúp để phát triển từ đầu kỹ ngôn ngữ, xã hội nhận thức Tuy nhiên, số trẻ tự kỷ phát muộn cao Trong xã hội ngày nay, mà áp lực sống ngày lớn, thành phố, cha mẹ bị theo dòng xốy kinh tế thị trường, khơng có nhiều thời gian quan tâm chăm sóc cái, biểu bất thường không quan tâm theo dõi kịp thời Đến cha mẹ phát mắc bệnh tự kỷ hầu hết muộn, “thời gian vàng” điều trị bệnh tự kỷ Theo số liệu bệnh viện Nhi trung ương, số trẻ phát muộn 44% Chẩn đốn bệnh y học ln lĩnh vực phức tạp Bởi đối tượng lĩnh vực người Hơn nữa, bệnh tự kỷ lại chưa xác định nguyên nhân đầy đủ, biểu bệnh bệnh nhân khác Bệnh nhân mắc bệnh tự kỷ có nhiều dấu hiệu dễ nhầm lẫn với bệnh khác bệnh tâm thần, bệnh trầm cảm Vì vậy, việc chẩn đốn bệnh tự kỷ lại khó khăn Với mong muốn góp phần phát triển phương pháp luận phục vụ việc dự đoán bệnh tự kỷ trẻ em, giúp bậc cha mẹ, thầy cô giáo, y bác sĩ phát bệnh sớm nhằm nâng cao hiệu điều trị bệnh, chọn đề tài “Nghiên cứu ứng dụng kỹ thuật định xây dựng hệ thống dự đoán bệnh tự kỷ trẻ em” làm đề tài tốt nghiệp Mục tiêu nghiên cứu Tìm hiểu kỹ thuật định để vận dụng xây dựng hệ thống hỗ trợ dự đoán bệnh tự kỷ trẻ em Để hoàn thành mục tiêu đặt ra, cần thực nhiệm vụ sau: - Tìm hiểu dấu hiệu nhận biết bệnh tự kỷ trẻ em; - Tìm hiểu kỹ thuật định; - Xây dựng hệ thống hỗ trợ dự đoán bệnh tự kỷ trẻ em 3 Đối tượng phạm vi nghiên cứu 3.1 Đối tượng nghiên cứu - Bệnh tự kỷ trẻ em - Các phương pháp chẩn đoán bệnh tự kỷ - Các kỹ thuật định 3.2 Phạm vi nghiên cứu - Tập trung tìm hiểu kỹ thuật định - Ứng dụng kỹ thuật vào hệ thống hỗ trợ dự đoán bệnh tự kỷ trẻ em Phương pháp nghiên cứu 4.1 Nghiên cứu lý thuyết - Thu thập, tìm hiểu, phân tích tài liệu bệnh tự kỷ - Tìm hiểu hệ hỗ trợ chẩn đốn bệnh tự kỷ trẻ em - Tìm hiểu định thuật toán định - Nghiên cứu công cụ xây dựng hệ thống 4.2 Nghiên cứu thực nghiệm - Thu thập liệu thực tế - Trích rút thuộc tính đặc trưng từ liệu thực tế - Phân tích yêu cầu chương trình - Thiết kế hệ thống triển khai xây dựng chương trình - Kiểm thử đánh giá kết Bố cục luận văn Nội dung luận văn gồm nội dung sau đây: Chương Tổng quan hội chứng tự kỷ trẻ em Nội dung chương giới thiệu kiến thức bệnh tự kỷ trẻ em, nguyên nhân gây bệnh, triệu chứng bệnh, dấu hiệu nhận biết tác hại bệnh tự kỷ Chương Cây định thuật toán xây dựng định Nội dung chương giới thiệu tổng quan định, ưu nhược điểm định thuật toán xây dựng định: ID3, C4.5, SPRINT,… Chương Ứng dụng định vào chẩn đoán bệnh tự kỷ trẻ em Nội dung chương trình bày quy trình ứng dụng kỹ thuật định chẩn đoán bệnh tự kỷ, biến đổi triệu chứng bệnh thành thuộc tính liệu vào kết luận bệnh thành thuộc tính liệu thuật tốn định Chương Xây dựng hệ thống chẩn đoán bệnh tự kỷ Nội dung chương tập trung phân tích yêu cầu hệ thống, xác định chức chính, xây dựng sơ đồ hoạt động ứng dụng, tiến hành cài đặt ứng dụng CHƯƠNG TỔNG QUAN VỀ HỘI CHỨNG TỰ KỶ Ở TRẺ EM 1.1 KHÁI NIỆM VỀ BỆNH TỰ KỶ 1.1.1 Giới thiệu bệnh tự kỷ 1.1.2 Khái niệm bệnh tự kỷ 1.2 NGUYÊN NHÂN CỦA BỆNH TỰ KỶ 1.2.1 Yếu tố môi trường 1.2.2 Yếu tố di truyền 1.2.3 Yếu tố tâm lý thần kinh 1.2.4 Yếu tố hoá chất 1.3 TRIỆU CHỨNG ĐẶC TRƯNG CỦA BỆNH TỰ KỶ 1.3.1 Tự kỷ trầm cảm 1.3.2 Triệu chứng lâm sàng a Dấu hiệu cảnh báo tuổi b Dấu hiệu cảnh báo tuổi - Khiếm khuyết quan hệ xã hội - Khiếm khuyết khả bắt chước - Khiếm khuyết khả đáp ứng tình cảm - Khiếm khuyết động tác thể - Khiếm khuyết sử dụng đồ vật - Khiếm khuyết khả thích nghi với thay đổi - Khiếm khuyết phản ứng thính giác - Khiếm khuyết phản ứng vị giác, khứu giác, xúc giác - Khiếm khuyết cảm giác sợ hãi hồi hộp - Khiếm khuyết giao tiếp lời - Khiếm khuyết giao tiếp không lời - Khiếm khuyết mức độ hoạt động - Khiếm khuyết đáp ứng trí tuệ 1.4 KẾT CHƯƠNG Chương trình bày nội dung sau: - Giới thiệu tổng quan bệnh tự kỷ - Các triệu chứng bệnh tự kỷ Chương trình bày tổng quan định thuật toán xây dựng định CHƯƠNG CÂY QUYẾT ĐỊNH VÀ THUẬT TOÁN XÂY DỰNG CÂY QUYẾT ĐỊNH 2.1 TỔNG QUAN VỀ CÂY QUYẾT ĐỊNH 2.1.1 Định nghĩa 2.1.3 Ứng dụng định chẩn đoán a Xác định lớp mẫu Trên sở biết giá trị thuộc tính mẫu X1, X2, …, Xn ta xác định thuộc tính định (hay phân lớp) Y đối tượng Kỹ thuật dùng để chẩn đoán b Rút luật từ Từ định, chuyển dạng luật để thuận tiện cho việc cài đặt sử dụng, thường chuyển luật theo quy tắc sau: luật biểu diễn dạng IF- THEN 2.1.4 Ưu nhược điểm định a Ưu điểm - Khả sinh quy tắc hiểu - Khả thực thi những lĩnh vực hướng quy tắc - Dễ dàng tính tốn phân lớp - Khả xử lý với thuộc tính liên tục rời rạc - Thể rõ ràng những thuộc tính tốt - Có khả thực tốt tập dữ liệu lớn thời gian ngắn b Nhược điểm - Dễ xảy lỗi có nhiều lớp - Chi phí học cao 2.2 THUẬT TỐN ID3 XÂY DỰNG CÂY QUYẾT ĐỊNH 2.2.1 Tiêu chí chọn thuộc tính Thuật tốn dùng độ đo độ lợi thơng tin IG để xác định điểm chia Xét bảng định DT = (U, C  {d} ), số giá trị (nhãn lớp) d k Ta có: k Entropy (U )   pi log pi (2.1) i 1 Trong pi tỉ lệ đối tượng DT mang nhãn lớp i IG xác định theo công thức sau: | Uv | Entropy (U v ) vVc | U | IG(U , c)  Entropy (U )   (2.2) Trong Vc tập giá trị thuộc tính c, Uv tập đối tượng DT có giá trị thuộc tính c v Thuộc tính chọn thuộc tính cho lượng thông tin thu thêm lớn 2.2.2 Thuật toán ID3 Giả mã thuật toán ID3 sau: Dữ liệu vào: Bảng định DT = (U, C  {d}) Dữ liệu ra: Mơ hình định Function Create_tree(U,C,{d}) Begin If tất mẫu thuộc nhãn lớp di then return nút gán nhãn di else if C = null then return nút có nhãn dj phổ biến DT else begin 10 end return kq; //Hàm trả thuộc tính có IG lớn End 2.2.3 Đánh giá thuật toán ID3 Ưu điểm thuật toán ID3: - Sử dụng thuật tìm kiếm leo đồi (hill - climbing) - Đầu giả thuyết đơn - Sử dụng liệu huấn luyện bước - Sử dụng thuộc tính tĩnh - Kiểm sốt liệu rác, liệu tạp bên Hạn chế thuật tốn ID3:
 - Khơng xử lý thuộc tính có kiểu giá trị liên tục - Khơng thích ứng với tập liệu tạp - Cây định sinh lớn, rườm rà, chưa tối ưu - Khơng có khả xử lý liệu thiếu giá trị thuộc tính 2.3 THUẬT TỐN C4.5 XÂY DỰNG CÂY QUYẾT ĐỊNH 2.3.1 Tiêu chí chọn thuộc tính Thuật tốn xét tất phép thử để phân chia tập liệu cho chọn phép thử có giá trị GainRatio tốt GainRatio( X , T )  Gain( X , T ) SplitInfo( X , T ) (2.3) 11 Với: SplitInfo( X , T )    iValue ( X ) | Ti | |T | log i |T | |T | (2.4) Trong đó: - Value (X) tập giá trị thuộc tính X - Ti tập tập T ứng với thuộc tính X có giá trị vi Thuộc tính lựa chọn để phân lớp thuộc tính có giá trị Gain Ratio lớn 2.3.2 Thuật toán C4.5 Dữ liệu vào: Tập liệu huấn luyện T Dữ liệu ra: Mơ hình định Function xay_dung_cay (T) Begin ; If Then Else ; For Do ; ; If Then ; For Do Begin If

Ngày đăng: 26/05/2020, 17:31

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan