5. Bố cục của luận văn
3.4. XÂY DỰNG HỆ THỐNG CHẨN ĐOÁN BỆNH RỐI LOẠN TRẦM
CẢM
Hệ thống được xây dựng bằng ngôn ngữ C# trên nền tảng .Net Framework. Bước đầu, hệ thống kết nối với CSDL và sử dụng các tập luật đã xây dựng ở chương 3 để đưa ra các dự đoán về khả năng mắc bệnh của bệnh nhân. Người dùng có thể nhập thông tin của bệnh nhân vào hệ thống và hệ thống sẽ đưa ra các kết quả chuẩn đoán kèm theo độ chính xác của dự đoán.
Giao diện sử dụng mô hình được xây dựng như sau:
Hình 3.10. Giao diện người dùng với hệ thống chẩn đoán bệnh RLTC
Hình 3.11. Giao diện thu thập thông tin người bệnh
Hệ thống cho phép người dùng nhập vào những thông tin cần thiết cho việc chẩn đoán như: thông tin cá nhân, yếu tố gia đình, trường học và những biểu hiện rối loạn trầm cảm trong một tuần qua, sau đó hệ thống thực hiện
chức năng chẩn đoán và cho ra kết quả chẩn đoán bệnh cho người dùng.
Hệ thống chẩn đoán bệnh rối loạn trầm cảm được xây dựng dựa vào mô hình cây quyết định cho kết quả như Hình 3.12.
Hình 3.12. Kết quả chẩn đoán bệnh từ mô hình cây quyết định
Với dữ liệu người dùng đã nhập ở Hình 3.11 hệ thống chẩn đoán bệnh cho kết quả là Yes ứng với bệnh nhân bị bệnh rối loạn trầm cảm với độ chính xác là: 97.23%.
Ứng với thông tin thu thập như Hình 3.11 hệ thống cũng đưa ra các đặc trưng cơ bản cho cụm này.
KẾT LUẬN CHƯƠNG 3
Chương này đã sử dụng thuật toán Decision Trees để xây dựng mô hình chẩn đoán bệnh RLTC với kết quả dự đoán của mô hình là: 98.91% và đưa ra được mức độ phụ thuộc của các dấu hiệu chẩn đoán bệnh RLTC. Ngoài ra, còn ứng dụng được kỹ thuật phân cụm với thuật toán K-Means để xác định các đặc trưng cơ bản của bệnh RLTC với độ chính xác của mô hình là 95% và đã xây dựng được Demo cho phép người dùng nhập dữ liệu về đặc điểm cá nhân cũng như các thông tin liên quan đến bệnh RLTC và đưa ra các dự báo về khả năng mắc chứng bệnh này. Demo được sử dụng ngôn ngữ C# trên nền tảng .Net Framework với giao diện thân thiện dễ sử dụng.
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI
Qua quá trình nghiên cứu và tìm hiểu về các vấn đề liên quan tới khai phá dữ liệu, luận văn đã hoàn thành và đạt được một số kết quả như sau:
Luận văn đã trình bày được cơ sở lý thuyết liên quan đến hai kỹ thuật cây quyết định và kỹ thuật phân cụm. Nghiên cứu quy trình khai phá dữ liệu. Ngoài ra, luận văn cũng tìm hiểu các công cụ Microsoft SQL Server 2014 Analysis services và Business Intelligence để xây dựng mô hình KPDL.
Đối với bài toán chẩn đoán bệnh trầm cảm cho học sinh, luận văn đã xây dựng mô hình chẩn đoán bệnh dựa trên thuật toán cây quyết định. Với dữ liệu huấn luyện ban đầu, mô hình cho phép phân tích các yếu tố ảnh hưởng đến kết quả chẩn đoán bệnh, mức độ phụ thuộc của từng triệu chứng đối với bệnh RLTC. Bên cạnh đó luận văn ứng dụng kỹ thuật phân cụm để tìm ra những đặc trưng của bệnh RLTC.
Trên cơ sở tri thức phát hiện được từ mô hình chẩn đoán, luận văn xây dựng được hệ thống hiển thị mô hình cây quyết định, mô hình phân cụm đến người dùng cuối.
Với việc triển khai hệ thống thử nghiệm cho thấy có khả năng ứng dụng kết quả này trong việc chẩn đoán bệnh RLTC cho học sinh. Hệ thống chẩn đoán bệnh này sẽ góp phần hỗ trợ cho nhà quản lý, bác sĩ và người dân tự theo dõi, phát hiện sớm bệnh RLTC để điều trị kịp thời.
Bên cạnh những kết quả đạt được, để đưa mô hình dự đoán vào ứng dụng một cách hiệu quả hơn thì cần tiếp tục đầu tư thu thập dữ liệu BN nhiều hơn nữa. Triển khai dự đoán, kiểm chứng thực tế và đánh giá kết quả một cách thường xuyên. Bản thân tôi nhận thấy đây là hướng tiếp cận đúng đắn và có tính thực tiễn cao
Hướng phát triển
Hạn chế của đề tài là mẫu dữ liệu sử dụng cho mô hình chưa nhiều, dữ liệu đầu vào cho mô hình mới chỉ được thu thập từ các hồ sơ bệnh án ở đối tượng trẻ vị thành niên thuộc tỉnh Quảng Trị. Vì vậy, mô hình chỉ chẩn đoán bệnh rối loại trầm cảm cho học sinh từ 12-18 tuổi. Trong thời gian tới, sẽ tiếp tục thu thập thêm dữ liệu để hoàn thiện mô hình, đồng thời nghiên cứu phát triển mô hình để xây dựng hệ thống chẩn đoán cho nhiều đối tượng khác nhau và tiếp tục nghiên cứu kỹ thuật cây quyết định để xây dựng mô hình chẩn đoán thêm một số bệnh khác…
TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt
[1] Trần Di Ái (1994), Đặc điểm tâm lý Trẻ em qua các lứa tuổi, Trung tâm nghiên cứu tâm lý Trẻ em, Nhà xuất bản Thế giới.
[2] Nguyễn Đức Cường (2010), Tổng quan về khai phá dữ liệu, Kỷ yếu Hội nghị Khoa học & Công nghệ lần thứ 9, ĐH Bách khoa TP.HCM. [3] Lê Thị Kim Dung (2007), Bước đầu tìm hiểu một số yếu tố ảnh hưởng đến
sức khỏe tâm thần của học sinh ở một số trường trung học cơ sở thuộc một số thành phố. Bộ Giáo dục và Đào tạo, mã số B2003-49- 61.
[4] Nguyễn Đăng Dung, Nguyễn Văn Xiêm (1991), Rối loạn Trầm cảm, Bách khoa thư bệnh học tập I, Trung tâm Quốc gia biên soạn từ điển bách khoa Việt Nam.
[5] Hoàng Thị Lan Giao (2010), Khai phá dữ liệu, Trường Đại học khoa học Huế.
[6] Nguyễn Thanh Hương (2010), Một số yếu tố nguy cơ và bảo vệ đối với vấn đề trầm cảm và lo âu của học sinh 2 trường trung học cơ sở thành phố Hà Nội, Nghiên cứu khoa học.
[7] Hoàng Kiếm – Đỗ Phúc (2005) Giáo trình khai phá dữ liệu, Trung tâm nghiên cứu phát tiễn công nghệ thông tin, Đại học Quốc gia TP HCM.
[8] Tổ chức Y tế thế giới (1992), Rối loạn khí sắc (cảm xúc), Phân loại bệnh quốc tế lần thứ 10 (ICD-/O) về các rối loạn tâm thần và hành vi, Geneve, tr. 79-105.
[9] Hoàng Cẩm Tú (2010), Nghiên cứu về rối loạn hành vi, cảm xúc ở trẻ em và trẻ vị thành niên, Nghiên cứu khoa học.
[10] Nguyễn Thị Thuỳ Vân (2014), Nghiên cứu tình hình rối loạn trầm cảm và một số yếu tố liên quan của học sinh trung học phổ thông, Luận văn thạc sĩ Y khoa.
Tài liệu tiếng Anh
[11] David Squire (2004), CSE5230 Tutorial: The ID3 Decision Tree Algorithm, Faculty of Information Technology, Monash University. [12] JamieMacLennan, ZhaoHui Tang, Bogdan Crivat (2008), Data Mining
with SQL Server 2008, Published by Wiley Publishing, Inc., Indianapolis, Indiana
[13] Rokach Lior; Maimon O. (2008), Data mining with decision trees: theory and applications”, World Scientific Pub Co Inc. ISBN 978- 9812771711.
[14] Radoloff, L.S (1977) “The CES-D scale: A self –report depression scale for research in the general population”. Applied Psychological measurement 1977. 1(3) pp.385-401.
Tài liệu Internet
[15] http://bis.net.vn/forums/p/374/822.aspx, “Thuật toán K-Means với bài toán phân cụm dữ liệu”.
[16] http://bis.net.vn/forums/t/458.aspx, “Giới thiệu công cụ xây dựng mô hình khai phá dữ liệu Business Intelligence Development Studio của Microsoft”.
[17] http://www.cise.ufl.edu/~ddd/cap6635/Fall-97/Short-papers/2.htm
[18] http://msdn.microsoft.com/en-us/library/ms173767.aspx (Introducing Business Intelligence Development Studio)
[19] http://www.who.int/mental_health/policy/en “Child and adolescent mental health policies and plans”, WHO (2005)
[20] Developing Application that uses Analysis Services, http://social.msdn.microsoft.com/Forums/zh/sqldatamining/thread/f b74ab56-1172-4460-8953-f566ca0a0cf3.
PHỤ LỤC
PHIẾU THU THẬP THÔNG TIN BIỂU HIỆN BỆNH RỐI LOẠI TRẦM CẢM
Mã số phiếu: …….
A. ĐẶC ĐIỂM CỦA BỆNH NHÂN
1. Họ và tên bệnh nhân:
2. Ngày tháng năm sinh: ………./…………../……….. 3. Giới tính: Nam Nữ
4. Kết quả học tập như thế nào?
Giỏi Khá Trung bình Yếu kém
B. YẾU TỐ GIA ĐÌNH VÀ TRƯỜNG HỌC
5. Tình trạng bố mẹ hoặc người thân cải nhau:
Chưa bao giờ Hiếm khi (1lần/tháng)
Thỉnh thoảng (2-3lần/tháng) Thường xuyên(>=4 lần/tháng) 6. Tình trạng bố mẹ hoặc người thân đánh nhau:
Chưa bao giờ Hiếm khi (1lần/tháng)
Thỉnh thoảng (2-3lần/tháng) Thường xuyên(>=4 lần/tháng) 7. Áp lực về kết quả học tập:
Hầu như không Áp lực ít Áp lực vừa Áp lực nhiều Áp lực rất nhiều
8. Mức độ thầy cô giáo ở trường trường xuyên nạt nộ, la mắng như thế nào? Thường xuyên Thỉnh thoảng
Hiếm khi Chưa bao giờ
9. Mức độ giáo viên trừng phạt nếu vi phạm là như thế nào: Thường xuyên Thỉnh thoảng
10.Mức độ bị bạn bè trêu chọc là:
Thường xuyên Thỉnh thoảng Hiếm khi Chưa bao giờ
11. Mức độ đánh nhau với bạn bè/bị bạn bè đánh đập là: Thường xuyên Thỉnh thoảng
Hiếm khi Chưa bao giờ
C. BIỂU HIỆN RỐI LOẠI TRẦM CẢM:
Xin vui lòng cho biết mức độ thường xuyên mà BN cảm nhận các dấu hiệu/hành vi dưới đây trong tuần qua, bằng cách dấu X vào cột tương ứng.
TT Câu hỏi
Mã hoá câu hỏi Hiếm khi hoặc không bao giờ <1 ngày Thỉnh thoảng (1 -2 ngày) Thường xuyên (3- 4 ngày) Hầu hết cả tuần (5-7 ngày)
F1 Tôi thấy khó chịu vì những điều mà bình thường không làm cho tôi thấy khó chịu.
F2 Tôi cảm thấy không muốn ăn hoặc ăn không ngon miệng. F3 Tôi cảm thấy không hết
buồn, mặc dù gia đình và bạn bè đã giúp đỡ.
F4 Tôi cảm thấy tôi cũng tốt như những người khác.
F5 Tôi đã gặp khó khăn để tập trung chú ý vào những việc mình đang làm.
F6 Tôi cảm thấy suy sụp và không vui.
F7 Tôi thấy quá mệt mỏi không thể làm gì được. F8 Tôi cảm thấy tràn đầy hy
vọng vào tương lai.
F9 Tôi nghĩ cuộc đời tôi từ trước đến nay toàn là thất bại. F10 Tôi cảm thấy sợ hãi. F11 Tôi ngủ không yên giấc. F12 Tôi cảm thấy vui vẻ/hạnh
phúc.
F13 Tôi nói chuyện ít hơn bình thường.
F14 Tôi cảm thấy cô đơn.
F15 Tôi thấy mọi người không thân thiện với tôi.
F16 Tôi thấy yêu thích cuộc sống. F17 Tôi khóc rất nhiều.
F18 Tôi cảm thấy buồn.
F19 Tôi cảm thấy mọi người không thích tôi.
F20 Tôi đã không thể bắt đầu những việc bình thường