Trong chương 3 luận văn đã tiến hành thực nghiệm 2 thuật toán học máy đã nghiên cứu trong chương 2 cho bài toán phân loại bệnh với bộ dữ liệu được trích xuất từ Bệnh viện Trung ương Quân đội 108.
Kết quả thử nghiệm bước đầu cho thấy các thuật toán học máy có thể triển khai trong thực tế và phù hợp với các yêu cầu đề ra cho bài toán phân loại bệnh.
54
KẾT LUẬN Các kết quả đạt được của luận văn
Qua nghiên cứu lý thuyết và tiến hành thực nghiệm, luận văn đã đạt được những kết quả chính như sau:
- Nghiên cứu tổng quan về bài toán phân loại và các vấn đề liên quan.
- Khảo sát tổng quan về các kỹ thuật học máy nhằm giải quyết bài toán phân bênh.
- Khảo sát tổng quan về học sâu.
- Khảo sát chi tiết hai thuật toán học máy bao gồm thuật toán cây quyết định và thuật toán máy vector hỗ trợ SVM.
- Thu thập và xử lý bộ dữ liệu kết quả xét nghiệm hóa nghiêm gồm 98 chỉ số xét nghiệm với 3863 mẫu của 06 nhóm bệnh.
- Thực hiện thử nghiệm hai thuật toán học máy j48 và SMO để phân loại bệnh trên bộ dữ liệu kết quả xét nghiệm hóa nghiêm. Luận văn cũng tiến hành phân tích đánh giá các kết quả thực nghiệm.
Hướng nghiên cứu tiếp theo
Tuy đạt được một số kết quả nêu trên, nhưng luận văn còn một số hạn chế do điều kiện về mặt thời gian và trình độ của học viên. Vì vậy, hướng nghiên cứu tiếp theo của luận văn là:
- Mở rộng thêm mặt bệnh phân loại và phân loại mặt bệnh chi tiết hơn. Ví dụ lớp mặt bệnh tiêu hóa có thể phân lớp thành 3 lớp chi tiết hơn: lớp bệnh về gan, về mật và về tụy.
- Phát triển thành chương trình ứng dụng để có thể hỗ trợ định hướng chẩn đoán bệnh trong bệnh viện.
55
DANH MỤC TÀI LIỆU THAM KHẢO
Tiếng Việt
[1] Nguyễn Đạt Anh (2013) - Các xét nghiệm thường quy áp dụng trong thực hành lâm sàng - Nhà xuất bản Y học.
[2] Văn phòng công nhận chất lượng, Bộ Khoa học và Công nghệ (2011), Hướng dẫn phân loại xét nghiệm y tế.
Tiếng Anh
[3] E. L. Allwein, R. E. Schapire, and Y. Singer (2001) – “Reducing multiclass to binary: A unifying approach for margin classifiers” - The Journal of Machine Learning Research, V.1, pp. 113–141.
[4] Tapan Bagchi, Rahul Samant, Milan Joshi (2013) – “SVM Classifiers Built Using Imperfect Training Data” - International Conference on Mathematical Techniques In Engineering Applications, ICMTEA 2013-BM-003.
[5] Christopher J.C. Burges (2000) – “A Tutorial on Support Vector Machines for Pattern Recognition” – Kluwer Academic Publishers, Boston.
[6] Ruben D. Canlas Jr. (2009) - “Data mining in healthcare: Current applications and issues”, MSc. of Science inInformation Technology, Carnegie Mellon University, Australia.
[7] Han J., Kamber M. (2011) – “Data mining: Concepts and Techniques” - 3nd Edition, Morgan Kaufman Publishers.
[8] Krzysztof J. Cios, G. William Moore (2002), “Uniqueness of medical data mining”, Artificial Intelligence in Medicine 26, p. 1–24.
[9] T. M. Mitchell [1997] – “Machine Learning”, McGraw-Hill.
[10] J. Milgram, M. Cheriet and R. Sabourin (2006) – ““One Against One” or “One Against All”: Which One is Better for Handwriting Recognition with SVMs?” - In Tenth International Workshop on Frontiers in Handwriting Recognition. Suvisoft.
56
[11] O’Sullivan, Dympna, et al. (2008) - “Using Secondary Knowledge to Support Decision Tree Classification of Retrospective Clinical Data” - Mining Complex Data (2008), pp. 238-251.
[12] A.S. Unal, M. Hacibeyoglu (2018)-“ Detection of DDoS Attacks in Network Traffic Using Deep Learning”, ICATCES 18, pp. 722-726.
[13] David Taniar (2007), Data Mining and Knowledge Discovery Technologies, Idea Group Publishing.
Trang WEB
[14] https://en.wikipedia.org/wiki/Precision_and_recal
[15] https://sourceforge.net/projects/weka/
57
PHỤ LỤC
Bảng các xét nghiệm được trích chọn xử lý trong luận văn
TT Tên xét nghiệm TT Tên xét nghiệm
1 AFP 26 GOT (AST)
2 Albumin máu 27 GPT (ALT)
3 Amoniac máu 28 GGT (Gamma GT)
4 Amylase máu 29 Glucose máu
5 Amylase niệu 30 HDL-C
6 Anti TG 31 Homocysteine
7 Anti-CCP 32 LDH
8 Apolipoprotein A1 33 LDL-C
9 ASLO 34 Máu lắng
10 Axit Uric máu 35 Microalbumin niệu 11 Acid Uric niệu 36 Pre-Albumin2 12 Bilirubin Total 37 Protein máu 13 Bilirubin Direct 38 Protein niệu 24h
14 BNP 39 CRP (định lượng)
15 Ca TP 40 RF
16 CK 41 Sắt
17 CK-MB 42 TSH
18 C peptide 43 Thyroglobulin
19 Creatinin máu 44 Triglycerid 20 Creatinin niệu 45 Troponin I
21 HS-CRP 46 Ure máu
22 Cholesterol Nước tiểu
23 Ferritin 47 BIL (Bilirubin)
24 FT3 48 BLD (Hồng cầu)