Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
1,04 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG HOÀNG THỊ THANH HIỀN ỨNG DỤNG KHAI PHÁ DỮ LIỆU ĐỂ XÂY DỰNG HỆ THỐNG CHẨN ĐOÁN BỆNH TRẦM CẢM CHO HỌC SINH PHỔ THƠNG Chun ngành: Hệ thống thơng tin Mã số : 60.48.01.04 TÓM TẮT LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Đà Nẵng - Năm 2016 Cơng trình hồn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TS NGUYỄN THANH BÌNH Phản biện 1: TS Phạm Anh Phương Phản biện 2: PGS.TS Lê Văn Sơn Luận văn bảo vệ trước hội đồng chấm Luận văn tốt nghiệp thạc sĩ Hệ thống thông tin họp Đại học Đà Nẵng vào ngày 31 tháng năm 2016 Có thể tìm hiểu luận văn tại: - Trung tâm Học liệu, Đại học Đà Nẵng - Thư viện Trường Đại học Sư Phạm, Đại Học Đà Nẵng MỞ ĐẦU Tính cấp thiết đề tài Hiện nay, trầm cảm bệnh diễn phổ biến có tác động phức tạp đến đời sống xã hội, lứa tuổi thiếu niên Nguyên nhân chủ yếu dẫn đến tượng vấn đề sức khoẻ tâm thần Sức khỏe tâm thần cấu phần quan trọng sức khỏe tổng thể trẻ Vấn đề sức khỏe tâm thần thời kỳ vị thành niên có mối liên quan chặt chẽ với nhiều hành vi như: uống rượu, hút thuốc, sử dụng ma túy, nguy tự tử,… ảnh hưởng đến sức khỏe trẻ trưởng thành Ở tuổi vị thành niên, rối loạn trầm cảm thường biểu thay đổi cảm xúc như: cảm thấy buồn, khóc, vơ vọng; khơng quan tâm đến hoạt động vui chơi, giải trí hay suy giảm hoạt động học tập; ăn không ngon miệng; hay thay đổi giấc ngủ; hay có khó chịu thể cách mơ hồ; ngồi trẻ nghĩ khơng thể làm việc đúng, cảm thấy sống khơng có ý nghĩa vơ vọng [6] Trầm cảm ảnh hưởng lớn đến lực học tập, giao tiếp; hình thành phát triển mối quan hệ xã hội, hoàn thiện thể chất, tinh thần tính cách trẻ Nếu rối loạn trầm cảm khơng quan tâm phòng ngừa can thiệp phù hợp tăng gánh nặng cho gia đình xã hội Do đó, yêu cầu cấp thiết cần phải có hệ thống chẩn đoán sàng lọc lâm sàng để phát sớm biểu rối loạn trầm cảm học sinh phổ thông nhằm đưa giải pháp can thiệp kịp thời việc phát triển sức khỏe Hiện nay, việc ứng dụng Công nghệ thông tin (CNTT) vào lĩnh vực y tế hạn chế, việc hỗ trợ tìm kiếm, khai thác thơng tin nhằm chẩn đốn biểu lâm sàng Trong đó, khai phá liệu kỹ thuật thường áp dụng để hỗ trợ đưa định xác Xuất phát từ thực tế trên, chọn đề tài “Ứng dụng khai phá liệu để xây dựng hệ thống chẩn đoán bệnh trầm cảm cho học sinh phổ thông” để nghiên cứu luận văn thạc sĩ Mục tiêu nghiên cứu nhiệm vụ nghiên cứu Mục tiêu nghiên cứu Nghiên cứu kỹ thuật khai phá liệu ứng dụng để xây dựng hệ thống hỗ trợ chẩn đoán bệnh rối loạn trầm cảm Nhiệm vụ nghiên cứu: - Tìm hiểu bệnh RLTC, tiến hành điều tra thu thập liệu - Nghiên cứu lý thuyết kỹ thuật phân lớp thuật toán định thuật tốn phân cụm - Xây dựng mơ hình để chẩn đoán bệnh RLTC cho học sinh dựa vào kỹ thuật định - Ứng dụng công cụ hỗ trợ khai phá Business Intelligence để xây dựng kiểm tra mơ hình - Đánh giá kết dự đốn mơ hình lựa chọn mơ hình tốt để chẩn đoán bệnh RLTC - Ứng dụng kỹ thuật định xây dựng hệ thống chẩn đoán bệnh trầm cảm học sinh - Ứng dụng kỹ thuật phân cụm để phân tích đặc trưng bệnh RLTC Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu - Dữ liệu nghiên cứu bao gồm đặc điểm cá nhân số yếu tố liên quan đến biểu rối loạn trầm cảm học sinh - Các kỹ thuật khai phá liệu, công cụ khai phá liệu mơđun lập trình khai phá liệu Phạm vi nghiên cứu - Số liệu thu thập gồm hồ sơ bệnh án thuộc đối tượng trẻ vị thành niên từ 12 -18 tuổi - Các kỹ thuật: phân lớp định kỹ thuật phân cụm - Công cụ hỗ trợ khai phá BI môđun hỗ trợ - Xây dựng hệ thống chẩn đốn bệnh tìm đặc trưng bệnh rối loạn trầm cảm Phương pháp nghiên cứu Phương pháp nghiên cứu lý luận - Thu thập, đọc hiểu thơng tin từ tài liệu, giáo trình liên quan đến khai phá liệu - Nghiên cứu kỹ thuật phân lớp liệu dựa vào định, ứng dụng kỹ thuật để chuẩn đốn bệnh rối loạn trầm cảm dựa vào thơng tin đầu vào - Tìm hiểu kỹ thuật phân cụm để phân tích đặc trưng bệnh RLTC Phương pháp nghiên cứu thực tiễn - Sử dụng kiến thức khai phá liệu cộng với tri thức chuyên gia bác sĩ, y học chứng cớ y học thực chứng trình khai phá liệu y khoa - Tiến hành so sánh kết kỹ thuật KPDL để lựa chọn kỹ thuật cho kết xác - Xây dựng hệ thống nhằm hỗ trợ bác sĩ việc chẩn đoán điều trị bệnh Bố cục luận văn Ngoài phần mở đầu, kết luận hướng phát triển, đề tài gồm chương: Chương 1: Tổng quan khai phá liệu Chương tìm hiểu trình bày nội dung: nghiên cứu tổng quan KPDL; kỹ thuật khai phá liệu định kỹ thuật phân cụm Chương 2: Nghiên cứu xử lý liệu bệnh rối loạn trầm cảm Chương trình bày nội dung sau: tìm hiểu đặc điểm tâm lý tuổi vị thành niên, khái niệm bệnh rối loạn trầm cảm, đặc điểm lâm sàng, yếu tố liên quan đến bệnh rối loại trầm cảm sở thu thập xử lý liệu nghiên cứu bệnh RLTC Ngoài trình bày cơng cụ xây dựng mơ hình khai phá liệu Chương 3: Xây dựng hệ thống chẩn đoán bệnh RLTC dựa khai phá liệu Chương trình bày liệu yêu cầu cho việc xây dựng mơ hình, tham số hỗ trợ cho thuật tốn từ ứng dụng kỹ thuật định để chẩn đoán bệnh sử dụng kỹ thuật phân cụm để phân tích đặc trưng bệnh rối loại trầm cảm cho học sinh Đồng thời chương xây dựng chương trình cài đặt thử nghiệm việc chẩn đoán bệnh kỹ thuật định kỹ thuật phân cụm sở liệu bệnh RLTC CHƯƠNG TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1 KHAI PHÁ DỮ LIỆU 1.1.1 Định nghĩa Khai phá liệu (KPDL) khái niệm đời vào năm cuối thập kỷ 80 Nó bao hàm loạt kỹ thuật nhằm phát thơng tin có giá trị tiềm ẩn tập liệu lớn Về chất, KPDL liên quan đến việc phân tích liệu sử dụng kỹ thuật để tìm mẫu có tính quy tập liệu Ở mức độ tổng qt, ta coi mục đích q trình KPDL mơ tả dự đốn [5] Nói tóm lại: KPDL q trình phát tri thức từ liệu thu thập 1.1.2 Quy trình KPDL Quy trình KPDL bao gồm bước hình sau: Bước Làm liệu (Data cleaning) Bước Tích hợp liệu (Data integration) Bước Trích chọn liệu (Data selection) Bước Chuyển đổi liệu (Data transformation) Bước Khai phá liệu (Data mining) Bước Ước lượng mẫu (Knowledge evaluation) Bước Biểu diễn tri thức (Knowledge presentation) 1.1.3 Các kỹ thuật KPDL - Cây định (Decision Tree) - Phân lớp liệu (Data Classification) - Phân cụm liệu (Data Clustering) - Khai phá luật kết hợp (Association Rule) - Hồi quy (Regression) - Giải thuật di truyền (Genetic Algorithm) - Mạng Nơron (Neural Network) 1.1.4 Những ứng dụng KPDL 1.2 KPDL BẰNG KỸ THUẬT CÂY QUYẾT ĐỊNH 1.2.1 Giới thiệu Trong lĩnh vực KPDL, định (Decision Tree - DT) mơ hình dự đốn thuộc lớp toán phân lớp dùng để xác định lớp đối tượng cần dự đoán DT dựa vào dãy luật để dự đoán lớp đối tượng DT có cấu trúc biểu diễn dạng 1.2.2 Cấu trúc DT 1.2.3 Các bước xây dựng DT 1.2.4 Ưu điểm DT 1.2.5 Thuật toán ID3 a Giới thiệu b Lựa chọn thuộc tính để kiểm tra c Giải thuật ID3 d Ví dụ e Đánh giá thuật tốn ID3 1.2.6 Thuật toán C4.5 a Giới thiệu Thuật toán C4.5 phát công bố Quinlan vào năm 1996 Thuật toán C4.5 thuật toán cải tiến từ thuật toán ID3, C4.5 giải hầu hết hạn chế ID3 C4.5 sử dụng độ đo Gain Ratio thực phân lớp tập mẫu liệu theo chiến lược ưu tiên theo chiều sâu dùng rộng rãi ứng dụng phân lớp với lượng liệu cỡ vài trăm nghìn ghi b Thuật toán C4.5 c Mội số cải tiến so với ID3 d Ví dụ thuật tốn C4.5 Bảng 1.2 Ví dụ thuật tốn C4.5 liệu chơi golf Day Outlook Temp Humidity Wind Play? Sunny Hot 85 Weak No Sunny Hot 90 Strong No Overcast Hot 78 Weak Yes Rain Mild 96 Weak Yes Rain Cool 80 Weak Yes Rain Cool 70 Strong No Overcast Cool 65 Weak Yes Sunny Mild 95 Weak No Sunny Cold 70 Weak Yes 10 Rain Mild 80 Strong Yes 11 Sunny Mild 70 Strong Yes 12 Overcast Mild 90 Strong Yes 13 Overcast Hot 75 Weak Yes 14 Rain Mild 80 Strong No Cây định sinh từ liệu Outlook Sunny Humidity >7.75 Overcast Wind Yes 7.75 Yes No rain Weak Yes Strong No Hình 1.4 Cây định chơi golf từ thuật toán C4.5 Luật rút từ định: Luật 1: if (Outlook = Sunny) and (Humidity >77.5) then Play= No Luật 2: if (Outlook = Sunny) and (Humidity 77.5) then Play= Yes Luật 3: if (Outlook = Overcast) then Play= Yes Luật 4: if (Outlook = Rain) and (Wind= Weak) then Play= Yes Luật 5: if (Outlook = Rain) and (Wind= Strong) then Play= No 1.3 KPDL BẰNG KỸ THUẬT PHÂN CỤM 1.3.1 Giới thiệu 1.3.2 Thuật toán K-Means Thuật toán K-Means thực qua bước Hình 1.5 10 CHƯƠNG NGHIÊN CỨU VÀ XỬ LÝ DỮ LIỆU VỀ BỆNH RỐI LOẠN TRẦM CẢM Trong chương này, luận văn trình bày đặc điểm tâm sinh lý tuổi vị thành niên, khái niệm bệnh RLTC, thực trạng bệnh RLTC đưa đặc điểm lâm sàng chung đặc điểm lâm sàng bệnh RLTC tuổi vị thành niên nói riêng liệt kê triệu chứng bệnh RLTC Trên sở để thu thập xử lý số liệu thực tế bệnh RLTC tỉnh Quảng Trị Ngoài chương trình bày thêm cơng cụ khai phá liệu để từ xây dựng mơ hình chẩn đốn bệnh RLTC 2.1 ĐẶC ĐIỂM TÂM SINH LÝ CỦA TUỔI VỊ THÀNH NIÊN 2.2 KHÁI NIỆM VỀ BỆNH RỐI LOẠN TRẦM CẢM Hiện nay, khái niệm RLTC Tổ chức Y tế giới áp dụng rộng rãi thực hành lâm sàng tâm thần học hầu hết quốc gia giới “Trầm cảm hội chứng bệnh lý biểu đặc trưng khí sắc trầm, quan tâm thích thú, giảm lượng dẫn đến mệt mỏi giảm hoạt động kèm theo số triệu chứng phổ biến rối loạn hành vi nhận thức, tập trung ý, tình dục, giấc ngủ ăn uống; Các triệu chứng phải kéo dài tuần [10] 2.3 THỰC TRẠNG BỆNH RỐI LOẠN TRẦM CẢM 2.4 ĐẶC ĐIỂM LÂM SÀNG CỦA BỆNH RLTC 2.4.1 Đặc điểm lâm sàng chung 2.4.1 Đặc điểm rối loạn trầm cảm trẻ vị thành niên - Khí sắc trầm cảm: Trẻ có cảm giác buồn chán mơ hồ, khơng giải thích nguyên cớ, hay cáu kỉnh - Giảm hứng thú học tập, cơng việc giao phó - Tư duy: Khó tập trung ý, khó tiếp thu học tập 11 - Các hoạt động xã hội: Trẻ thu lập khơng muốn giao tiếp tham gia hoạt động đồn thể, phàn nàn khơng có bạn thân khó chia sẻ với bạn - Rối loạn ăn: Thường bật cảm giác chán ăn, khơng có hứng thú ăn uống, cảm giác ngon miệng, hậu trẻ bị giảm cân - Rối loạn giấc ngủ, trẻ ngủ nhiều bình thường ngủ ít, nhiều trường hợp trẻ thường xuyên có ác mộng - Tự sát triệu chứng quan trọng cần quan tâm bệnh lý trầm cảm trẻ vị thành niên 2.5 CHẨN ĐỐN BỆNH RỐI LOẠN TRẦM CẢM Chẩn đốn giai đoạn trầm cảm dựa vào triệu chứng sau: [14] - triệu chứng đặc trưng: + Khí sắc trầm + Mất quan tâm thích thú + Giảm lượng dẫn đến mệt mỏi giảm hoạt động - triệu chứng phổ biến: + Giảm sút tập trung ý + Giảm sút tính tự trọng lòng tin + Những ý tưởng bị tội khơng xứng đáng + Nhìn vào tương lai ảm đạm bi quan + Ý tưởng hành vi tự huỷ hoại tự sát + Rối loạn giấc ngủ bệnh nhân thường ngủ vào cuối giấc + Ăn ngon miệng 2.6 CÁC YẾU TỐ LIÊN QUAN ĐẾN BỆNH RLTC 2.6.1 Yếu tố gia đình 2.6.2 Yếu tố học đường 2.6.3 Yếu tố xã hội 12 2.7 THU THẬP VÀ XỬ LÝ DỮ LIỆU NGHIÊN CỨU BỆNH RLTC 2.7.1 Thu thập liệu Việc thu thập liệu tuỳ theo lĩnh vực ngành nghề Mỗi ngành, liệu lưu trữ có nguyên tắc riêng Việc lấy liệu cần thực theo quy định hay quy chế quan, đơn vị Dữ liệu khai phá luận văn hồ sơ bệnh án, mượn hồ sơ bệnh án để nghiên cứu phải có đơn xin mượn hồ sơ bệnh án giấy giới thiệu quan quản lý Số liệu thu thập 4000 hồ sơ bệnh án thời gian năm (1/2013-1/2016) gồm hồ sơ bệnh nhân thuộc đối tượng trẻ vị thành niên từ 12-18 tuổi, đến thăm khám Khoa tâm thần - bệnh viện đa khoa tỉnh Quảng Trị, số phòng khám tư nhân Phòng Y tế trường THPT, THCS địa bàn tỉnh Quảng Trị Các thông tin liệu phân bổ rời rạc, có khoảng 1500 bệnh án điện tử lại hồ sơ bệnh án lưu sổ sách Do đó, phải thu thập, gộp lại cách thủ công vào file excel Dữ liệu thu thập dựa bảng câu hỏi thu thập thông tin bệnh rối loạn trầm cảm (xem phần Phụ lục), tư vấn chuyên môn, nghiệp vụ bác sĩ khoa tâm thần bệnh viên Đa khoa tỉnh Quảng Trị nên liệu có tính trung thực khách quan cao 2.7.2 Xử lý liệu Bước Làm đầy loại bỏ ghi có trường liệu bị thiếu loại bỏ liệu bị trùng lặp - Sử dụng lệnh Data filter Excel để tìm trường liệu rỗng tiến hành làm đầy liệu trường Giới tính - Xố ghi có giá trị rỗng mà làm đầy - Sử dụng lệnh Remove Duplicates excel để xoá ghi trùng lặp 13 Bước Tiến hành mã hóa tên trường liệu, giá trị liệu đảm bảo tính quán - Tiến hành bỏ dấu - Loại bỏ thông tin họ tên bệnh nhân - Năm sinh chuyển thành Tuổi - Trường kết quả: Yes = Mắc bệnh, No = Không mắc bệnh Sau thu thập xử lý liệu, luận văn tiến hành nghiên cứu công cụ xây dựng mơ hình KPDL 2.8 CÁC CƠNG CỤ XÂY DỰNG MƠ HÌNH KPDL 2.8.1 Hệ quản trị CSDL SQL Server 2014 2.8.2 Cơng cụ xây dựng mơ hình KPDL Business Intelligence 2.9 KPDL VỚI MSSQL SERVER 2014 ANALYSIS SERVICES 2.9.1 Môi trường phát triển ứng dụng 2.9.2 Các thuật toán KPDL MSSQL Server 2014 KẾT LUẬN CHƯƠNG Chương trình bày đặc điểm tâm sinh lý tuổi vị thành niên; nêu khái niệm; đặc điểm lâm sàng bệnh rối loạn trầm cảm, trình bày triệu chứng bệnh RLTC, nêu yếu tố ảnh hưởng đến bệnh rối loạn trầm cảm trình bày cộng cụ hỗ trợ xây dựng mơ hình khai phá liệu Chương giới thiệu cách thu thập xử lý liệu bệnh trầm cảm học sinh phổ thông Đề tài thu thập xử lý 4000 dòng liệu từ Khoa tâm thần - bệnh viện đa khoa tỉnh Quảng Trị số phòng khám tư nhân, Phòng Y tế trường THPT, THCS địa bàn tỉnh Quảng Trị để xây dựng sở liệu làm tiền giải toán chẩn đoán bệnh RLTC 14 CHƯƠNG XÂY DỰNG HỆ THỐNG CHẨN ĐOÁN BỆNH RỐI LOẠN TRẦM CẢM DỰA TRÊN KHAI PHÁ DỮ LIỆU Sau xây dựng CSDL chương 2, chương trình bày kỹ thuật định để KPDL xây dựng mơ hình chuẩn đốn bệnh RLTC Sau đó, chương sử dụng kỹ thuật phân cụm để đưa đặc trưng cho cụm bệnh nhân bệnh Cuối chương phần cài đặt hệ thống thử nghiệm tập luật khai phá Hệ thống cho phép người dùng nhập liệu đặc điểm cá nhân thông tin liên quan đến bệnh RLTC đưa dự báo khả mắc chứng bệnh 3.1 XÂY DỰNG CSDL TRONG SQL SERVER 3.1.1 Mô tả liệu 3.1.2 Bài toán chẩn đoán bệnh RLTC Để biết người có mắc phải bệnh RLTC hay khơng bệnh nhân phải đến bệnh viện phòng khám tư để thăm khám lâm sàng, làm xét nghiệm máu kiểm tra tuyến giáp điền vào bảng câu hỏi để đánh giá tâm lý sở y tế có đầy đủ trang thiết bị hỗ trợ Tuy nhiên, vấn đề đặt ta chẩn đốn kết tương tự không cần làm xét nghiệm y khoa tốn thời gian nhiều chi phí Thay vào ta dự đốn bệnh thông qua liệu từ thông tin cá nhân, yếu tố gia đình, yếu tố trường học, việc học tập, mối quan hệ bạn bè, biểu sức khoẻ ngày qua rối loạn giấc ngủ, mệt mỏi, ăn khơng ngon miệng, cảm thấy buồn, khó chịu, không tập trung công việc, suy sụp tinh thần, trò chuyện… hay khơng? 15 3.1.3 Lựa chọn giải thuật giải toán Ở đề tài này, chúng tơi khơng có tham vọng tìm hiểu hết tất thuật toán nêu thuật tốn thơng dụng để từ áp dụng vào đề tài Kết mong muốn xây dựng mơ hình dựa vào thuật tốn định DT, thuật tốn phân cụm để có tập luật nhằm đưa định chẩn đoán cho toán 3.1.4 Xây dựng mơ hình Dữ liệu nguồn dùng để xây dựng mơ hình 4000 bệnh nhân Sau kết nối DataSource SQL Server Data Tools để đến SQL Server, Data Source View có khung nhìn bảng CSDL với trường Khóa ID Hình 3.1 Hình 3.1 Khung nhìn bảng liệu 3.2 ỨNG DỤNG KỸ THUẬT DT ĐỂ XÂY DỰNG MÔ HÌNH CHẨN ĐỐN BỆNH RLTC 3.2.1 Dữ liệu u cầu cho việc xây dựng mơ hình DT 3.2.2 Những tham số hỗ trợ thuật toán DT 3.2.3 Xây dựng mơ hình KPDL kết đạt Luận văn chọn thuật toán Decision Trees, cho kết mơ Hình 3.4 16 Hình 3.4 Cây định chuẩn đoán bệnh RLTC 17 3.2.4 Mức độ phụ thuộc dấu hiệu chẩn đoán bệnh RLTC Từ kết KPDL theo mơ hình DT, hệ thống cho thấy yếu tố ảnh hưởng đến kết bênh RLTC thể Hình 3.5 Hình 3.5 Các yếu tố ảnh hưởng đến bệnh RLTC 3.2.5 Đánh giá mơ hình dự đốn Với liệu huấn luyện 70% liệu test 30%, mơ hình đưa kết chẩn đốn với độ xác lên đến: 98.91% Hình 3.6 Ma trận biểu diễn khả chẩn đốn mơ hình DT 18 3.3 ỨNG DỤNG KỸ THUẬT PHÂN CỤM ĐỂ PHÂN TÍCH CÁC ĐẶC TRƯNG CỦA BỆNH RLTC 3.3.1 Dữ liệu yêu cầu cho việc xây dựng mơ hình phân cụm 3.3.2 Xây dựng mơ hình phân cụm Đề tài sử dụng thuật tốn K-mean để phân cụm, Kết cho thấy mơ hình có độ xác đến 95% Hình 3.8 Ma trận biểu diễn kết mơ hình phân cụm 3.3.3 Kết mơ hình phân cụm bệnh RLTC Mơ hình cho kết Hình 3.9 Hình 3.9 Những đặc trưng chi tiết bệnh RLTC cụm Kết cụm liệu với đặc trưng khác sau: 19 Cụm 1: Cụm đa số BN có giới tính Nữ, tuổi từ 15-16, tuần BN có mắc phải dấu hiệu sau: cảm thấy buồn, khó chịu, q mệt mỏi khơng thể làm từ 3-4 ngày, cảm thấy vui vẻ/hạnh phúc, yêu thích sống có 1-2 ngày,thường xuyên bị giáo viên trừng phạt, chứng kiến bố mẹ/ người thân cải từ 3-4 lần/tháng Cụm đa số BN bị mắc bệnh RLTC Cụm Cụm đa số BN có giới tính Nữ, tuổi từ 18, tuần BN có mắc phải dấu hiệu sau: cảm thấy buồn, nói chuyện bình thường, q mệt mỏi khơng thể làm từ 5-7 ngày, cảm thấy vui vẻ/hạnh phúc, u thích sống có 4 lần/tháng Cụm đa số BN bị mắc bệnh RLTC Cụm Cụm đa số BN có giới tính Nữ, tuổi 17, tuần BN có dấu hiệu sau: cảm thấy buồn, khó chịu, hay khóc, q mệt mỏi khơng thể bắt đầu việc bình thường từ 3-4 ngày, cảm thấy vui vẻ/hạnh phúc, yêu thích sống từ 1-2 ngày, ngủ khơng n giấc từ 5-7 ngày, thường xuyên bị bạn trêu chọc, chứng kiến bố mẹ người thân cải từ 3-4 lần/tháng Cụm đa số BN bị mắc bệnh RLTC Cụm Cụm đa số người có giới tính Nam, độ tuổi 18, tuần BN có dấu hiệu sau: thấy khó chịu, khơng thể bắt đầu việc bình thường từ 1-2 ngày, cảm thấy vui vẻ/hạnh phúc, yêu thích sống từ 3-4 ngày, chưa bị giáo viên trừng phạt, chứng kiến bố mẹ người thân cải 4 lần/tháng Cụm đa số BN bị mắc bệnh RLTC 2.10 XÂY DỰNG HỆ THỐNG CHẨN ĐOÁN BỆNH RLTC Hệ thống xây dựng ngôn ngữ C# tảng Net Framework Bước đầu, hệ thống kết nối với CSDL sử dụng tập luật xây dựng chương để đưa dự đoán khả mắc bệnh BN Người dùng nhập thơng tin BN vào hệ thống hệ thống đưa kết chuẩn đốn kèm theo độ xác dự đốn Giao diện sử dụng mơ hình xây dựng sau: Hình 3.10 Giao diện người dùng với hệ thống chẩn đoán bệnh RLTC 21 Trang nhập thơng tin bệnh nhân Hình 3.11 Giao diện thu thập thông tin người bệnh Hệ thống cho phép người dùng nhập vào thông tin cần thiết cho việc chẩn đốn như: thơng tin cá nhân, yếu tố gia đình, trường học biểu rối loạn trầm cảm tuần qua, sau hệ thống thực chức chẩn đoán cho kết chẩn đoán bệnh cho người dùng Hệ thống chẩn đoán bệnh rối loạn trầm cảm xây dựng dựa vào mô hình định cho kết Hình 3.12 Hình 3.12 Kết chẩn đốn bệnh từ mơ hình định Với liệu người dùng nhập Hình 3.11 hệ thống chẩn đốn bệnh cho kết Yes ứng với bệnh nhân bị bệnh rối loạn trầm cảm với độ xác là: 97.23% 22 Ứng với thơng tin thu thập Hình 3.11 hệ thống đưa đặc trưng cho cụm Hình 3.13 Kết mơ hình phân cụm KẾT LUẬN CHƯƠNG Chương sử dụng thuật tốn Decision Trees để xây dựng mơ hình chẩn đốn bệnh RLTC với kết dự đốn mơ hình là: 98.91% đưa mức độ phụ thuộc dấu hiệu chẩn đốn bệnh RLTC Ngồi ra, ứng dụng kỹ thuật phân cụm với thuật toán K-Means để xác định đặc trưng bệnh RLTC với độ xác mơ hình 95% xây dựng Demo cho phép người dùng nhập liệu đặc điểm cá nhân thông tin liên quan đến bệnh RLTC đưa dự báo khả mắc chứng bệnh Demo sử dụng ngôn ngữ C# tảng Net Framework với giao diện thân thiện dễ sử dụng 23 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI Kết đạt được: Qua trình nghiên cứu tìm hiểu vấn đề liên quan tới khai phá liệu, luận văn hoàn thành đạt số kết sau: Luận văn trình bày sở lý thuyết liên quan đến hai kỹ thuật định kỹ thuật phân cụm Nghiên cứu quy trình khai phá liệu Ngồi ra, luận văn tìm hiểu công cụ Microsoft SQL Server 2014 Analysis services Business Intelligence để xây dựng mơ hình KPDL Đối với toán chẩn đoán bệnh trầm cảm cho học sinh, luận văn xây dựng mơ hình chẩn đốn bệnh dựa thuật toán định Với liệu huấn luyện ban đầu, mơ hình cho phép phân tích yếu tố ảnh hưởng đến kết chẩn đoán bệnh, mức độ phụ thuộc triệu chứng bệnh RLTC Bên cạnh luận văn ứng dụng kỹ thuật phân cụm để tìm đặc trưng bệnh RLTC Trên sở tri thức phát từ mơ hình chẩn đốn, luận văn xây dựng hệ thống hiển thị mơ hình định, mơ hình phân cụm đến người dùng cuối Với việc triển khai hệ thống thử nghiệm cho thấy có khả ứng dụng kết việc chẩn đoán bệnh RLTC cho học sinh Hệ thống chẩn đoán bệnh góp phần hỗ trợ cho nhà quản lý, bác sĩ người dân tự theo dõi, phát sớm bệnh RLTC để điều trị kịp thời Bên cạnh kết đạt được, để đưa mơ hình dự đoán vào ứng dụng cách hiệu cần tiếp tục đầu tư thu thập liệu BN nhiều Triển khai dự đoán, kiểm chứng thực tế 24 đánh giá kết cách thường xuyên Bản thân nhận thấy hướng tiếp cận đắn có tính thực tiễn cao Hướng phát triển Hạn chế đề tài mẫu liệu sử dụng cho mơ hình chưa nhiều, liệu đầu vào cho mơ hình thu thập từ hồ sơ bệnh án đối tượng trẻ vị thành niên thuộc tỉnh Quảng Trị Vì vậy, mơ hình chẩn đốn bệnh rối loại trầm cảm cho học sinh từ 12-18 tuổi Trong thời gian tới, tiếp tục thu thập thêm liệu để hoàn thiện mơ hình, đồng thời nghiên cứu phát triển mơ hình để xây dựng hệ thống chẩn đốn cho nhiều đối tượng khác tiếp tục nghiên cứu kỹ thuật định để xây dựng mơ hình chẩn đoán thêm số bệnh khác… ... bàn tỉnh Quảng Trị để xây dựng sở liệu làm tiền giải toán chẩn đoán bệnh RLTC 14 CHƯƠNG XÂY DỰNG HỆ THỐNG CHẨN ĐOÁN BỆNH RỐI LOẠN TRẦM CẢM DỰA TRÊN KHAI PHÁ DỮ LIỆU Sau xây dựng CSDL chương 2,... trường học biểu rối loạn trầm cảm tuần qua, sau hệ thống thực chức chẩn đoán cho kết chẩn đoán bệnh cho người dùng Hệ thống chẩn đoán bệnh rối loạn trầm cảm xây dựng dựa vào mơ hình định cho kết... lựa chọn mơ hình tốt để chẩn đoán bệnh RLTC - Ứng dụng kỹ thuật định xây dựng hệ thống chẩn đoán bệnh trầm cảm học sinh - Ứng dụng kỹ thuật phân cụm để phân tích đặc trưng bệnh RLTC Đối tượng