7. Bố cục của luận văn
3.5 SO SÁNH VỚI CÁC ĐỀ TÀI TƢƠNG TỰ
Thời gian qua cũng có nhiều đề tài ứng dụng KPDL để xây dựng một hệ thống nhằm chẩn đoán bệnh nhƣ: Hoàng Thị Thanh Hiền, ứng dụng khai phá dữ liệu để xây dựng hệ thống chẩn đoán bệnh trầm cảm cho học sinh phổ thông, Đại học Đà Nẵng. Trƣơng Minh Văn, ứng dụng khai phá dữ liệu chẩn đoán bệnh sốt xuất huyết, Đại học Lạc Hồng. Nguyễn Đức
Phong, ứng dụng khai phá dữ liệu xây dựng hễ thống hỗ trợ chẩn đoán
bệnh tim mạch, Đại học Đà Nẵng. Mục tiêu của các đề tài trên là nghiên
cứu về KPDL và ứng dụng vào xây dựng hệ thống chẩn đoán bệnh, và đã đạt đƣợc những kết quả khả quan. Còn về ứng dụng KPDL vào chẩn đoán bệnh HPQ và VPQ cho đối tƣợng trẻ em thì chƣa có tác giả nào nghiên cứu. Chính vì thế tác giả đã nghiên cứu về khai phá dữ liệu, cây quyết định và đặc biệt là thuật toán C4.5 để làm cơ sở lý thuyết xây dựng nên hệ thống, với CSDL là các HSBA.
Trong luận văn này tác giả có sử dụng phƣơng pháp CTDL trong KPDL y khoa, lựa chọn đặc tính theo kinh nghiệm của chuyên gia (y bác sỹ). Luận văn đã đạt đƣợc độ chính xác trong huấn luyện dữ liệu là
95.64% so với các đề tài của Hoàng Thanh Hiền là 97,23% [4], đề tài của Trƣơng Minh Văn là 88,88%[9].
Luận văn này tác giả cũng đã xây dựng thêm chức năng huấn luyện dữ liệu tích hợp vào hệ thống làm cho ngƣời sử dụng tiện khi cần huấn luyện dữ liệu thay vì phải sử dụng phần mềm weka hay các phần mềm khác hỗ trợ.
KẾT LUẬN CHƢƠNG 3
Trong chƣơng này, luận văn đã trình bày các chức năng của hệ thống, sử dụng thuật toán C4.5 xây dựng và kiểm thử hệ thống dựa trên những số liệu cụ thể. Hệ thống đáp ứng đầy đủ các yêu cầu chuyên môn trong việc chẩn đoán bệnh cho ngƣời dùng. Nó giúp cho ngƣời dùng và đặc biệt là các cán bộ y tế thôn bản chẩn đoán đƣợc bệnh một cách chích xác từ đó có hƣớng điều trị phù hợp.
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN CỦA ĐỀ TÀI
1. Kết quả đã đạt đƣợc
Luận văn đã trình bày đƣợc cơ sở lý thuyết liên quan đến KPDL, phân lớp dữ liệu, thuật toán cây quyết định ID3, C4.5, nghiên cứu về hai bệnh HPQ và VPQ. Nghiên cứu đƣợc quy trình triển khai ứng dụng KPDL, và ứng dụng thuật toán C4.5 để tạo ra hệ thống chẩn đoán bệnh.
Đối với bài toán chẩn đoán bệnh HPQ và VPQ cho trẻ em luận văn đã xây dựng mô hình chẩn đoán bệnh dựa trên kỹ thuật cây quyết định. Hệ thống đáp ứng đầy đủ các yêu cầu chuyên môn trong việc chẩn đoán bệnh cho ngƣời dùng. Nó giúp cho ngƣời dùng và đặc biệt là các cán bộ y tế thôn bản chẩn đoán đƣợc bệnh một cách chính xác từ đó có hƣớng điều trị phù hợp.
2. Hạn chế của luận văn
Nhìn chung luận văn đã cơ bản hoàn thành các mục tiêu đề ra. Tuy nhiên vẫn còn những hạn chế sau.
Số lƣợng mẫu dữ liệu về hồ sơ bệnh án chƣa nhiều, cần tiếp tục thu thập dữ liệu hồ sơ bệnh án nhiều hơn nữa.
Chƣa áp dụng các kỹ thuật khai phá dữ liệu khác để so sánh và lựa chọn kỹ thuật tối ƣu.
3. Hƣớng phát triển của đề tài
Hệ thống mới chỉ chẩn đoán đƣợc bệnh HPQ và VPQ cho đối tƣợng trẻ em. Trong thời gian tới sẽ tiếp tục thu thập thêm dữ liệu cho các đối tƣợng khác từ đó mở rộng cho hệ thống chẩn đoán đƣợc bệnh HPQ và VPQ cho các đối tƣợng khác nữa.
Tiếp tục nghiên cứu các thuật toán KPDL bằng cây quyết định nhƣ thuật toán CHAID, thuật toán MARS, thuật toán ADTNDA (dựa vào độ phụ thuộc mới của thuộc tính) để nâng cao hiệu quả mô hình cây quyết định từ đó chẩn đoán bệnh một cách chính xác hơn.
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1] Chƣơng trình nhiễm khuẩn hô hấp cấp tính (ARI), "Xử trí nhiễm khuẩn hô hấp cấp tính trẻ em ở bệnh viện huyện". Bộ y tế.
[2] Nguyễn Việt Cồ, Trần Quị (2000), Giáo trình nhiễm khuẩn hô hấp cấp tính trẻ em, Y học.
[3] Đại Học Y Dƣợc Thành Phố Hồ Chí Minh (2011), Giáo Trình Nhi Khoa. [4] Hoàng Thị Thanh Hiền (2016), ứng dụng khai phá dữ liệu để xây dựng
hệ thống chẩn đoán bệnh trầm cảm cho học sinh phổ thông, Đại học
Đà Nẵng.
[5] Hoàng Kiếm, Đỗ Phúc (2005), Giáo Trình khai phá dữ liệu, Trung tâm
nghiên cứu phát triển công nghệ thông tin Đại học Quốc gia TP HCM. [6] Tô Thị Minh (2009), Nghiên cứu thực trạng bệnh hen phế quản và chỉ số
Peakflow ở học sinh tiểu học và Trung học cơ sở thành phố Thái Nguyên, Trƣờng Đại học Y Dƣợc Thái Nguyên.
[7] Lê Thu Phong (2012), Thực trạng về phân loại và xử lý ban đầu bệnh nhân suy hô hấp cấp tại Khoa cấp cứu, Đại học Thăng Long.
[8] Hoàng Trọng Quang (2000), Bài giảng nhi khoa, Nhà xuất bản Y Học. [9] Trƣơng Minh Văn (2012), ứng dụng khai phá dữ liệu chẩn đoán bệnh
sốt xuất huyết, Đại học Lạc Hồng.
Tiếng Nƣớc Ngoài
[10] A. KusiaK (2001), "Data Farming Methods for Temporal Data Mining". [11] IJCSI International Journal of Computer Science Issues, Vol. 9, Issue 5,
No3, September 2012, Random Forests and Decision Trees.
Trang web
[12] https://vi.wikipedia.org/wiki/cây_quyết_định [13] https://en.wikipedia.org/wiki/C4.5_algorithm.
Ngành: Hệ thống thông tin
Họ và tên học viên: Trần Văn Đồng
Người hướng dẫn khoa học: TS. Nguyễn Hoàng Hải
Cơ sở đào tạo: Trường Đại học Sư phạm, Đại học Đà Nẵng Tóm tắt:
Luận văn đã trình bày được cơ sở lý thuyết liên quan về khai phá dữ liệu, quy trình khai phá dữ liệu, các kỹ thuật khai phá bằng cây quyết định, tổng quan về hai bệnh HPQ (hen phế quản) và VPQ (viêm phế quản). Trong đó đặc biệt là kỹ thuật khai phá dữ liệu bằng cây quyết định đã trình bày chi tiết về giải thuật ID3 và C4.5 đồng thời nêu được điểm cải tiến của thuật toán C4.5 so với ID3. Nghiên cứu được quy trình triển khai ứng dụng KPDL, tiến hành thu thập, tiền xử lý dữ liệu và ứng dụng thuật toán C4.5 để tạo ra hệ thống chẩn đoán bệnh.
Đối với bài toán chẩn đoán bệnh HPQ và VPQ cho trẻ em luận văn đã xây dựng mô hình chẩn đoán bệnh dựa trên kỹ thuật cây quyết định. Hệ thống đáp ứng đầy đủ các yêu cầu chuyên môn trong việc chẩn đoán bệnh cho người dùng. Nó giúp cho người dùng và đặc biệt là các cán bộ y tế thôn bản chẩn đoán được bệnh một cách chích xác từ đó có hướng điều trị phù hợp.
Với sự trợ giúp của máy tính, đề tài đóng góp một biện pháp thực hiện hỗ trợ cho người nhà bệnh nhân và các cán bộ y tế chẩn đoán bệnh cho bệnh nhân. Kết quả, kinh nghiệm thu được khi thực hiện đề tài này sẽ giúp các cán bộ y tế phát hiện sớm bệnh cho bệnh nhân, đồng thời mong muốn những người đang công tác trong lĩnh vực Y học và công nghệ thông tin hợp tác lại với nhau hơn nữa để tìm ra những giải pháp tốt hơn trong vấn đề chẩn đoán và điều trị bệnh.
Chẩn đoán bệnh và phát hiện bệnh là cả một quá trình hết sức quan trọng. Nếu chẩn đoán bệnh sai sẽ đưa đến điều trị sai, không phát hiện được bệnh cho bệnh nhân. Sẽ dẫn đến những tổn thất lớn về tinh thần lẫn vật chất cho bệnh nhân và gia đình họ. Việc phát hiện bệnh sớm thì khả năng thất bại trong điều trị sẽ giảm hoặc có thể giúp bệnh nhân và gia đình họ đưa ra những quyết định điều trị thích hợp. Vì vậy đề tài này sẽ giúp các cán bộ y tế chẩn đoán và phát hiện được bệnh sớm để đưa ra những phác đồ điều trị hiệu quả đồng thời theo dõi, cảnh báo và tư vấn giúp bệnh nhân tránh những biến chứng nguy hiểm, giảm gánh nặng kinh tế cho gia đình và xã hội.
Hệ thống mới chỉ chẩn đoán được bệnh HPQ và VPQ cho đối tượng trẻ em. Trong thời gian tới sẽ tiếp tục thu thập thêm dữ liệu cho các đối tượng khác từ đó mở rộng cho hệ thống chẩn đoán được bệnh HPQ và VPQ cho các đối tượng khác nữa. Tiếp tục nghiên cứu các thuật toán khai phá dữ liệu khác để nâng cao hiệu quả mô hình cây quyết định từ đó chẩn đoán bệnh một cách chính xác hơn.
Xác nhận của người hướng dẫn Người thực hiện đề tài
Full name of Master student: Tran Van Dong Supervisors: Dr. Nguyen Hoang Hai
Training institution: Danang Education University, the University of Danang Summary:
The thesis presents the theoretical background related to data mining, data mining procedures, decision tree mining techniques, overview of two bronchial asthma and inflammation Bronchial. Particularly, the decision tree data mining technique details the algorithms of ID3 and C4.5 and concludes the improvement of algorithm C4.5 versus ID3. Research on the application of data mining, data collection, data reprocessing and application of C4.5 algorithm to develop a disease diagnosis system.
For the bronchial asthma and inflammation Bronchial diagnostic problems for pediatric children, a diagnostic model was developed based on decision tree technique. The system fully meets the professional requirements for diagnosing the user. It helps users and especially village health workers diagnose the disease in an accurate way, from which providing an appropriate treatment.
With the help of a computer, the subject contributes a measure of support to the patient's family and the medical staff to diagnose the patient. The results obtained during this research project will help health workers to identify patients early and at the same time expect those working in the field of medicine and information technology to cooperate and to find better solutions to the problem of diagnosis and treatment.
Diagnosis and detection is a very important process. If the diagnosis is inaccurate, it will lead to
inaccurate treatment, so no disease is diagnosed for the patient. Especially, it will lead to great mental and material losses for patients and their families. Early detection of the disease is likely to reduce treatment failure or may help the patient and his family make appropriate treatment decisions. Thus, this topic will help health workers diagnose and detect early disease to provide effective treatment regimens while monitoring, warning and counseling to help patients avoid dangerous complications, reduce the economic burden on families and society.
The system only diagnoses bronchial asthma and inflammation Bronchial for children. In the future, we will continue to collect additional data for other subjects, thereby extending our coverage to other bronchial asthma and inflammation Bronchial diagnostic systems. Continuing to study other data mining algorithms to improve the efficiency of the decision tree model from which the disease diagnosis is more accurate.
Supervisor’s confirmation Student
Dr. Nguyen Hoang Hai Tran Van Dong