Ứng dụng khai thác dữ liệu phân loại các triệu chứng lâm sàng của bệnh tiểu đường type 2 giai đoạn đầu (tiền đái tháo đường) – phân tích mức độ tác động

53 6 0
Ứng dụng khai thác dữ liệu phân loại các triệu chứng lâm sàng của bệnh tiểu đường type 2 giai đoạn đầu (tiền đái tháo đường) – phân tích mức độ tác động

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ TP.HCM CƠNG TRÌNH DỰ THI GIẢI THƯỞNG ĐỀ TÀI MÔN HỌC XUẤT SẮC UEH500 - NĂM 2021 TÊN CÔNG TRÌNH: Ứng dụng khai thác liệu phân loại triệu chứng lâm sàng bệnh tiểu đường Type giai đoạn đầu (Tiền đái tháo đường) – Phân tích mức độ tác động lựa chọn mơ hình dự đốn nguy mắc bệnh THUỘC KHOA: TỐN – THỐNG KÊ MSĐT (Do BTC ghi): TP HỒ CHÍ MINH - 2021 download by : skknchat@gmail.com TÓM TẮT Theo số liệu thống kê Hiệp hội đái tháo đường quốc tế IDF vào tháng 10/2020, có đến nửa số lượng người bệnh tiểu đường chưa phát triệu chứng không rõ ràng Ở Việt Nam, bệnh tiểu đường nguyên nhân tử vong đứng thứ top bệnh khơng lây nhiễm Vì thế, tác giả thực đề tài “Ứng dụng khai thác liệu phân loại triệu chứng lâm sàng bệnh tiểu đường Type giai đoạn đầu (Tiền đái tháo đường) - Phân tích mức độ tác động lựa chọn mơ hình dự đốn nguy mắc bệnh” với mong muốn giúp người nhận biết triệu chứng có khả cao dẫn đến nguy mắc bệnh tiểu đường người bệnh gốc Châu Á nói chung người Việt Nam nói riêng Bài nghiên cứu sử dụng ba phương pháp phân tích bao gồm Cây định, Mạng thần kinh Hồi quy Logistic Các phương pháp xử lý thực phần mềm Clementine 12.0 Bài nghiên cứu bao gồm bốn phần Phần lý thuyết phương pháp, tổng quan liệu, phân tích kết từ đưa kết luận hướng phát triển đề tài Tác giả mong muốn nghiên cứu cung cấp lượng thông tin cần thiết bệnh tiểu đường cho người, giúp người cân nhắc tình trạng sức khỏe thân để kịp thời phát triệu chứng bất thường, đặc biệt đối tượng có người thân bị bệnh tiểu đường hay người trung niên, người già Cuối cùng, nghiên cứu mong muốn mở rộng kết hợp thêm kiến thức chuyên sâu y học, tiến hành nghiên cứu thực tế để đem lại kết cụ thể xác nhất, phổ biến kiến thức bệnh đến người nhằm hạn chế số lượng ca bệnh I download by : skknchat@gmail.com MỤC LỤC TÓM TẮT I MỤC LỤC II DANH MỤC BẢNG BIỂU IV CHƯƠNG I TỔNG QUAN .VI Lý chọn đề tài VI Vấn đề nghiên cứu VII Mục tiêu nghiên cứu VII Tính đề tài VIII Phương pháp nghiên cứu VIII Đóng góp đề tài VIII Kết cấu nghiên cứu .IX CHƯƠNG II CƠ SỞ LÝ THUYẾT 1 Khái niệm khai thác liệu Ứng dụng khai thác liệu Các kỹ thuật khai thác liệu 3.1 Cây định 3.2 Mạng thần kinh 3.3 Hồi quy Logistic Đánh giá mơ hình 4.1 Độ tin cậy 4.2 Ma trận trùng CHƯƠNG III TIẾN HÀNH PHÂN TÍCH II download by : skknchat@gmail.com Tổng quan liệu Xây dựng mơ hình 13 Nhận xét đánh giá kết 13 3.1 Cây định 13 3.2 Mơ hình mạng thần kinh 30 3.3 Hồi quy Logistic 32 3.4 Lựa chọn mơ hình tối ưu để dự đốn nguy mắc bệnh 36 CHƯƠNG IV KẾT LUẬN 39 Kết luận chung 39 Liên hệ thực tiễn Việt Nam 39 Hạn chế 40 Hướng nghiên cứu mở rộng 40 TÀI LIỆU THAM KHẢO I Danh mục tài liệu Tiếng Việt I Danh mục tài liệu Tiếng Anh II III download by : skknchat@gmail.com DANH MỤC BẢNG BIỂU Bảng 1.1 Bảng tóm tắt thơng tin biến Bảng 3.1 Bảng tổng hợp triệu chứng dựa định C5.0 17 Bảng 3.2 Bảng tổng hợp triệu chứng dựa định QUEST 23 Bảng 3.3 Bảng tổng hợp triệu chứng dựa định CHAID 28 Bảng 3.4 Bảng so sánh độ xác ba phương pháp định 29 Bảng 3.5 Bảng Case Processing Summary 32 Bảng 3.6 Bảng Model Fitting Information 32 Bảng 3.7 Bảng Pseudo R - Square 33 Bảng 3.8 Bảng Parameter Estimates 34 Bảng 3.9 Bảng so sánh ba phương pháp định, mạng thần kinh hồi quy Logistic 36 Hình 1.1 Sơ đồ tổng qt bước chạy mơ hình định mạng thần kinh 12 Hình 1.2 Sơ đồ tổng qt bước chạy mơ hình hồi quy Logistic 12 Hình 2.1 Biểu đồ thể số lượng bệnh nhân có nguy mắc bệnh khơng có nguy mắc bệnh 13 Hình 3.1 Đồ thị thể mức độ quan trọng biến định C5.0 14 Hình 3.2 Mơ hình định C5.0 15 Hình 3.3 Ma trận trùng định C5.0 19 Hình 3.4 Đồ thị thể mức độ quan trọng biến định QUEST 20 Hình 3.5 Mơ hình định QUEST 21 Hình 3.6 Ma trận trùng định QUEST 24 Hình 3.7 Đồ thị thể mức độ quan trọng biến định CHAID 25 Hình 3.8 Mơ hình định CHAID 26 IV download by : skknchat@gmail.com Hình 3.9 Ma trận trùng định CHAID 29 Hình 3.10 Đồ thị thể mức độ quan trọng biến mạng thần kinh 30 Hình 3.11 Ma trận trùng mạng thần kinh 31 Hình 3.12 Ma trận trùng hồi quy Logistic 35 V download by : skknchat@gmail.com CHƯƠNG I TỔNG QUAN Lý chọn đề tài Bệnh tiểu đường hay gọi đái tháo đường bệnh mãn tính khơng thể chữa lành Nó coi “Kẻ giết người thầm lặng” với biểu lượng Glucose máu cao mức bình thường thể khơng sản xuất đủ Insulin thể giảm đáp ứng với tác dụng Insulin, dẫn đến rối loạn chuyển hóa Glucose, gây tượng lượng Glucose tích tụ tăng dần máu Lượng Glucose máu thường xuyên mức cao qua thời gian làm tăng nguy mắc bệnh tim mạch, làm tổn thương tới quan khác mắt, thận, thần kinh dẫn đến bệnh lý nghiêm trọng khác Bệnh đái tháo đường có nhiều dạng bao gồm đái tháo đường Type 1, Type Type Ở đái tháo đường Type 2, người bệnh bị đề kháng với Insulin, nghĩa thể sản xuất Insulin khơng thể chuyển hóa Glucose Khoảng 90% đến 95% người bị tiểu đường giới Type Bệnh đái tháo đường bệnh nguy hiểm khơng lây nhiễm, có diễn biến âm thầm ảnh hưởng lên mạch máu toàn thể khoảng thời gian Thường bệnh phát cách tình cờ sau khám có biểu khó chịu thể Nếu rơi vào trường hợp phát trễ, việc tiếp nhận điều trị bị muộn làm cho bệnh nhân gặp phải nhiều biến chứng mãn tính ảnh hưởng đến mạch máu, võng mạc mắt, tim mạch, đột quỵ não, suy thận, thần kinh nặng nề biến chứng cấp tính mê tử vong Bệnh tiểu đường gia tăng theo cấp số nhân Theo báo cáo vào tháng 10 năm 2020 Hiệp hội đái tháo đường quốc tế IDF (International Diabetes Federation) cho thấy, 11 người lớn từ 18 tuổi trở lên lại có người mắc bệnh tiểu đường, giây giới lại có người tử vong, 30 giây lại có người phần thể bệnh lý Theo thống kê, có đến 50% số lượng người bệnh tiểu đường chưa phát triệu chứng không rõ ràng VI download by : skknchat@gmail.com Việt Nam 10 quốc gia có tỉ lệ mắc bệnh tiểu đường cao Châu Á nằm 10 quốc gia có tỉ lệ gia tăng cao giới Ở Việt Nam, bệnh tiểu đường nguyên nhân tử vong đứng thứ top bệnh không lây nhiễm Vào năm 2017, theo Chủ tịch hội Nội tiết Đái tháo đường Việt Nam, bệnh nhân mắc tiểu đường nước ta ghi nhận số khoảng 540 000 người, chiếm khoảng 5,5% dân số dự đoán tăng lên mức khoảng 7,7% dân số vào năm 2045 Bên cạnh đó, khoảng 5,3 triệu người bị tiền đái tháo đường với 70% chuyển thành đái tháo đường với nguy tử vong cao Hiện nay, đái tháo đường không cướp sinh mạng hàng triệu người năm mà bệnh cịn có xu hướng ngày trẻ hóa với tốc độ nhanh chóng Vì vậy, với số biết nói trên, đề tài mong nghiên cứu giúp đưa kết nghiên cứu chung khả thi khu vực Châu Á, từ làm tảng phát triển cho nghiên cứu sâu Việt Nam cấp thiết vấn đề Vấn đề nghiên cứu Nghiên cứu triệu chứng lâm sàng bệnh tiểu đường Type giai đoạn đầu đánh giá mức độ tác động triệu chứng đến nguy mắc bệnh Từ đó, xây dựng mơ hình dự đoán nguy mắc bệnh so sánh mơ hình, lựa chọn mơ hình dự báo tối ưu Mục tiêu nghiên cứu Tác giả thực đề tài “Ứng dụng khai thác liệu phân loại triệu chứng lâm sàng bệnh tiểu đường Type giai đoạn đầu (Tiền đái tháo đường) - Phân tích mức độ tác động lựa chọn mơ hình dự đốn nguy mắc bệnh” để phân loại triệu chứng lâm sàng thể rõ nguy mắc bệnh tiểu đường Type giai đoạn đầu, sau xây dựng mơ hình dự báo nguy mắc bệnh tốt Vì vậy, đề tài mong muốn giúp cho người có nhìn rõ triệu chứng bệnh để chủ động kiểm tra sức khỏe thân thường xuyên, từ phát hiện, chẩn đoán bệnh giai đoạn sớm VII download by : skknchat@gmail.com để chữa trị kịp thời kiểm soát bệnh mức tối ưu xuất triệu chứng, tránh ảnh hưởng xấu sức khỏe hạn chế mức thấp số lượng ca bệnh phát triển thầm lặng nguy hiểm bệnh Tính đề tài Đối với nghiên cứu y học liên quan đến bệnh tiểu đường, đa số sử dụng số y học chuyên ngành thường tập trung nghiên cứu bệnh nhân mắc bệnh để tìm phương pháp y học điều trị Trong đề tài này, tác giả không sử dụng số y học để phân tích mà tập trung vào triệu chứng lâm sàng thực tế, gần gũi hơn, với mong muốn giúp người bình thường có nhìn tổng quan nguy mắc bệnh, cung cấp kiến thức bệnh Hơn nữa, đề tài nhấn mạnh nghiên cứu giai đoạn đầu bệnh tiểu đường, giai đoạn mà bệnh phát triển cách âm thầm lặng lẽ thường người bệnh không phát hay bị nhầm lẫn với triệu chứng bệnh khác Vì thế, nghiên cứu sâu giai đoạn đầu giúp người bệnh chữa khỏi hồn tồn khơng phải tiếp nhận điều trị suốt đời phát điều trị sớm, hạn chế số lượng đầu vào bệnh tiểu đường Phương pháp nghiên cứu Trong nghiên cứu này, tác giả ứng dụng ba phương pháp nghiên cứu Khai thác liệu bao gồm Sơ đồ định, mạng thần kinh hồi quy Logistic Bên cạnh đó, tác giả sử dụng phần mềm Clementine 12.0 để tiến hành phân tích số liệu thu thập phục vụ cho nghiên cứu Đóng góp đề tài Tác giả mong nghiên cứu góp phần cung cấp bổ sung thêm thông tin bệnh tiểu đường, đặc biệt vào giai đoạn đầu - giai đoạn phát triển thầm lặng bệnh, thông qua triệu chứng lâm sàng thường gặp phải Đối với bệnh nhân xuất triệu chứng lạ, phát sớm điều trị tốt, người bệnh VIII download by : skknchat@gmail.com chữa khỏi bệnh không tiến triển thành tiểu đường Type 2, hạn chế số lượng ca mắc bệnh Bên cạnh đó, tiểu đường Type cịn bệnh di truyền theo gia đình thường xuất người trung niên người già Vì thế, người có người thân, gia đình mắc bệnh tiểu đường hay người lớn tuổi, cần theo dõi sức khỏe thân cách định kỳ, quan tâm đến biểu lạ thể để giúp phòng ngừa phát kịp thời có nguy mắc bệnh, đảm bảo sức khỏe cho gia đình Kết cấu nghiên cứu Bài nghiên cứu gồm chương Chương I Tổng quan: Giới thiệu tổng quát đề tài nghiên cứu Chương II Cơ sở lý thuyết: Trình bày sở lý thuyết khái niệm Chương III Kết nghiên cứu: Phân tích kết nghiên cứu để đưa kết luận triệu chứng lâm sàng thể rõ nguy mắc bệnh Từ đó, xây dựng mơ hình dự báo nguy mắc bệnh thơng qua triệu chứng gặp phải Chương IV Kết luận: Tóm tắt kết ý nghĩa nghiên cứu, liên hệ thực tiễn Việt Nam, hạn chế gặp phải để đề xuất hướng nghiên cứu mở rộng thêm tương lai IX download by : skknchat@gmail.com Hình 3.9 Ma trận trùng định CHAID Bảng sơ đồ Results for output field Ketqua cho ta thấy kết tỉ lệ việc chạy mơ hình định CHAID mẫu thử mẫu dùng để chạy kết mơ hình Ta thấy số 424 mẫu dùng để chạy có 399 mẫu chạy kết đúng, chiếm tỉ lệ 94,1% Đồng thời, số 180 mẫu thử tỉ lệ đạt 89,44% Như vậy, độ xác phù hợp mơ hình tính tốn dựa vào bảng Coincidence Matrix for $R-Ketqua (rows show actuals) mẫu Testing, ta có: 83 + 78 × 100 = 89,44% 180 3.1.4 So sánh ba loại định Sau phân tích loại định C5.0, QUEST CHAID, tác giả lập bảng so sánh kết phân tích dựa vào độ xác phù hợp mơ hình: Bảng 3.4 Bảng so sánh độ xác ba phương pháp định Cây định Độ xác phù hợp C5.0 QUEST CHAID 93,33% 89,44% 89,44% 29 download by : skknchat@gmail.com Do mơ hình định C5.0 có độ dự đốn xác cao hai mơ hình cịn lại nên phương pháp định, mơ hình C5.0 tối ưu Vì thế, mơ hình C5.0 lựa chọn làm đại diện cho mơ hình định 3.2 Mơ hình mạng thần kinh Hình 3.10 Đồ thị thể mức độ quan trọng biến mạng thần kinh Khi sử dụng phương pháp mạng thần kinh, tác giả chọn số vòng quay 1000 vòng Bảng Variable Importance cho ta biết mức độ quan trọng biến mơ hình mạng thần kinh Ở đây, biến Tiểu nhiều biến quan trọng việc phân loại nguy mắc bệnh tiểu đường Biến quan trọng thứ hai Khát nhiều thứ ba biến Giới tính Biến thứ tư biến Cáu gắt, thứ năm Ngứa, thứ sáu Nấm Candida Tiếp theo biến 30 download by : skknchat@gmail.com Căng cơ, giảm thị lực, tuổi, tê bì chân tay, ăn nhiều, vết thương khó lành, béo phì, giảm cân đột ngột, suy nhược cuối rụng tóc nhiều Hình 3.11 Ma trận trùng mạng thần kinh Bảng sơ đồ Results for output field Ketqua cho ta thấy kết tỉ lệ việc chạy mơ hình mạng thần kinh mẫu thử mẫu dùng để chạy kết mơ hình Ta thấy 424 mẫu chạy kết 100% Đồng thời số 180 mẫu thử tỉ lệ 100% Vì thế, kết luận mơ hình mạng thần kinh có độ giải thích xác cao Đây mơ hình đáng tin cậy việc dự báo biến phụ thuộc “Kết quả” để đưa kết tốt cho mục tiêu nghiên cứu phân loại nguy bệnh nhân mắc bệnh tiểu đường Type giai đoạn đầu, giúp nghiên cứu khả quan 31 download by : skknchat@gmail.com 3.3 Hồi quy Logistic Bảng 3.5 Bảng Case Processing Summary Bảng 3.6 Bảng Model Fitting Information *Các kiểm định mục tác giả sử dụng với mức ý nghĩa 5%, độ tin cậy 95% Với bảng Model Fitting Information, ta có kiểm định:  Kiểm định mức độ phù hợp mơ hình H0: Mơ hình khơng phù hợp với liệu H1: Mơ hình phù hợp với liệu Ta thấy p-value = 0.000 < α = 0.05  Bác bỏ H0 Kết luận: Mơ hình phù hợp với liệu 32 download by : skknchat@gmail.com  Chỉ số -2 Log Likelihood -2 Log Likelihood = 587,751: Thường dùng việc lựa chọn mơ hình, mơ hình có số nhỏ độ phù hợp mơ hình tốt Bảng 3.7 Bảng Pseudo R - Square  Hệ số R2 (Sử dụng kết Nagelkerke) R2=0,869: R2 0,869, mơ hình hồi quy phù hợp với tập liệu mức 86,9% Cụ thể là, 86,9% biến thiên biến phụ thuộc giải thích biến độc lập mơ hình (cịn 13,1% lượng nhiễu, sai số đo lường, cách thu thập liệu có biến độc lập khác giải thích cho biến phụ thuộc mà chưa đưa vào mơ hình nghiên cứu) Với số kết luận biến phụ thuộc giải thích tốt mơ hình khả dự đốn mơ hình 33 download by : skknchat@gmail.com Bảng 3.8 Bảng Parameter Estimates Với bảng Parameter Estimates biến Ketqua ta có kiểm định:  Kiểm định ý nghĩa biến độc lập  Tuoi: Giả thuyết: H0: Biến độc lập Tuoi khơng có ý nghĩa thống kê H1: Biến độc lập Tuoi có ý nghĩa thống kê Ta thấy p-value Tuoi = 0,496 > α = 0,05  Bác bỏ H0 Vậy biến độc lập Tuoi khơng có ý nghĩa thống kê mơ hình 34 download by : skknchat@gmail.com Kiểm định tương tự với 16 biến độc lập lại ta thu kết có biến có ý nghĩa thống kê Giới tính, tiểu nhiều, khát nhiều, nấm Candida, ngứa cáu gắt, trùng với biến quan trọng phân loại dựa vào phương pháp mạng thần kinh Bên cạnh đó, 10 biến cịn lại khơng có ý nghĩa thống kê mơ hình Từ kiểm định trên, ta viết phương trình Hồi quy Logistic biến phụ thuộc  Phương trình hồi quy Logistic (dự báo xác suất nguy mắc bệnh): 𝑃1 𝑙𝑜𝑔𝑒 ( ) = −3,207 − 0,018 ∗ 𝑇𝑢𝑜𝑖 + 3,911 ∗ 𝐺𝑖𝑜𝑖𝑡𝑖𝑛ℎ + 5,262 ∗ 𝑇𝑖𝑒𝑢𝑛ℎ𝑖𝑒𝑢 + 5,330 𝑃0 ∗ 𝐾ℎ𝑎𝑡𝑛ℎ𝑖𝑒𝑢 + 0,023 ∗ 𝐺𝑖𝑎𝑚𝑐𝑎𝑛𝑑𝑜𝑡𝑛𝑔𝑜𝑡 + 0,893 ∗ 𝑆𝑢𝑦𝑛ℎ𝑢𝑜𝑐 + 0,306 ∗ 𝐴𝑛𝑛ℎ𝑖𝑒𝑢 + 2,022 ∗ 𝑁𝑎𝑚𝐶𝑎𝑛𝑑𝑖𝑑𝑎 + 1,052 ∗ 𝐺𝑖𝑎𝑚𝑡ℎ𝑖𝑙𝑢𝑐 − 2,915 ∗ 𝑁𝑔𝑢𝑎 + 1,253 ∗ 𝐶𝑎𝑢𝑔𝑎𝑡 − 0,064 ∗ 𝑉𝑒𝑡𝑡ℎ𝑢𝑜𝑛𝑔𝑘ℎ𝑜𝑙𝑎𝑛ℎ + 0,625 ∗ 𝑇𝑒𝑏𝑖𝑐ℎ𝑎𝑛𝑡𝑎𝑦 − 0,589 ∗ 𝐶𝑎𝑛𝑔𝑐𝑜 − 0,627 ∗ 𝑅𝑢𝑛𝑔𝑡𝑜𝑐𝑛ℎ𝑖𝑒𝑢 + 0,088 ∗ 𝐵𝑒𝑜𝑝ℎ𝑖 Trong đó: P0 xác suất khơng có nguy mắc bệnh P1 xác suất có nguy mắc bệnh  Bảng sơ đồ Results for output field Ketqua Hình 3.12 Ma trận trùng hồi quy Logistic Bảng sơ đồ Results for output field Ketqua cho ta thấy kết tỉ lệ việc chạy mơ hình hồi quy Logistic mẫu thử mẫu dùng để chạy kết mô hình Ta thấy số 424 mẫu dùng để chạy có đến 415 mẫu chạy kết đúng, chiếm tỉ lệ 97,88% Đồng thời, số 180 mẫu thử tỉ lệ đạt 95% 35 download by : skknchat@gmail.com Như vậy, độ xác phù hợp mơ hình tính tốn dựa vào bảng Coincidence Matrix for $L-Ketqua (rows show actuals) mẫu Testing, ta có: 82 + 89 × 100 = 95% 180 3.4 Lựa chọn mơ hình tối ưu để dự đoán nguy mắc bệnh Bảng 3.9 Bảng so sánh ba phương pháp định, mạng thần kinh hồi quy Logistic Cây định C5.0 Mạng thần kinh Hồi quy Logistics 94,34% 100% 95% Độ xác phù hợp Sử dụng quy tắc dạng Có độ xác tuyệt Đưa nhìn Nếu – để cung cấp đối, cao so với rõ ràng mối phương tiện hình thành phương pháp khác quan hệ nên mơ hình dự đốn Đáng tin cậy để xác biến, mô tả ước cách trực quan định mức độ quan tính mối quan hệ dễ hiểu trọng biến biến nhị mơ hình Từ đó, phân phụ thuộc Ưu điểm xác định các biến độc lập nhóm triệu chứng tác mơ hình động mạnh tới nguy Tính tốn xác mắc bệnh suất nguy mắc bệnh thông qua phương trình hồi quy Logistic Có độ xác thấp Xây dựng hệ thống Có độ xác cao so với hai phương mối quan hệ thứ hai ba Nhược điểm pháp lại mạng lưới nút phương pháp (giao điểm kết nối) 36 download by : skknchat@gmail.com Mơ hình định cung thông qua máy phụ thuộc lớn vào tính học từ liệu Vì liệu, thế, có vậy, thay đổi nhỏ thấy kết dự liệu cấu trúc mơ báo mà khơng biết hình định có rõ kết hình thể bị thay đổi hoàn thành qua tồn xử lý máy tính Qua ba phương pháp định C5.0, mạng thần kinh hồi quy Logistic, ta biết, loại kĩ thuật sử dụng cho mục đích riêng Cho nên, phương pháp tồn ưu, nhược điểm khác Đối với phương pháp định, thuật tốn xây dựng mơ hình phân loại, dự báo cách trực quan dễ hiểu lại có độ xác phù hợp mơ hình chưa cao so với hai phương pháp lại Đối với phương pháp mạng thần kinh, thuật toán đem tới độ xác phù hợp mơ hình lên tới 100%, cao so với hai phương pháp cịn lại lại khơng cho biết lý hình thành nên kết dự đốn Tuy nhiên, mạng thần kinh giúp xác định cách xác nhóm biến quan trọng mơ hình Đối với mơ hình hồi quy Logistic, có độ xác thấp chút so với mạng thần kinh thuật tốn giải thích cụ thể mối quan hệ biến độc lập biến phụ thuộc thông qua hệ số mơ hình hồi quy Mặt khác, sáu biến quan trọng rút từ kết mơ hình mạng thần kinh sáu biến có ý nghĩa mơ hình hồi quy Logistic, bao gồm biến Giới tính, tiểu nhiều, khát nhiều, nấm Candida, ngứa cáu gắt, điều làm tăng thêm độ tin cậy tính tốn xác suất nguy mắc bệnh dựa vào phương trình hồi quy Logistic Qua nhận định trên, phương án tốt mà tác giả lựa chọn sử dụng ba mơ hình để cải thiện khả phân loại, kết mô hình hỗ trợ, giải thích lẫn 37 download by : skknchat@gmail.com Nguy mắc bệnh tiền tiểu đường liên quan đến nhiều triệu chứng khác triệu chứng cịn có tác động qua lại Vì thế, kết hợp sử dụng ba mơ hình, ngồi nhóm biến tác động mạnh đến nguy mắc bệnh thu từ kết Mạng thần kinh Hồi quy Logistics bao gồm: Giới tính, tiểu nhiều, khát nhiều, nấm Candida, ngứa, cáu gắt bổ sung thêm biến tác động kết mơ hình Cây định Tuổi, giảm cân đột ngột rụng tóc nhiều 38 download by : skknchat@gmail.com CHƯƠNG IV KẾT LUẬN Kết luận chung Dựa vào kết phân tích qua nhiều phương pháp khác nhau, ta thấy kết dự báo nguy mắc bệnh tiểu đường Type giai đoạn đầu có tỉ lệ xác cao Do đó, kết phân tích nghiên cứu đáng tin cậy để phân loại cách tổng quát triệu chứng tác động mạnh đến việc mắc bệnh, nhóm triệu chứng bao gồm: Tiểu nhiều, khát nhiều, nấm Candida, ngứa, cáu gắt, giảm cân đột ngột rụng tóc nhiều Bên cạnh đó, giới tính độ tuổi ảnh hưởng lớn đến nguy mắc bệnh, lần nghiên cứu này, giới tính nữ độ tuổi trung niên thường có xu hướng mắc bệnh cao Cuối cùng, tác giả lựa chọn phương án sử dụng kết hợp ba mô hình để thu kết dự đoán, phân loại tối ưu nguy mắc bệnh tiểu đường Type giai đoạn đầu thông qua triệu chứng lâm sàng Vì thế, với bệnh mãn tính nguy hiểm tiềm tàng bệnh Tiểu đường, cần thận trọng cảnh giác với Nếu thân xuất triệu chứng phải lưu ý, theo dõi tình trạng sức khỏe thường xuyên, đến trung tâm y tế để thăm khám, kiểm tra đường huyết định kỳ Đặc biệt người độ tuổi trung niên thuộc giới tính nữ đối tượng cần theo dõi nhiều Liên hệ thực tiễn Việt Nam Tiểu đường (Đái tháo đường) bệnh toàn cầu với số ca mắc bệnh toàn giới riêng Việt Nam mức cao Theo Hiệp hội đái tháo đường quốc tế (IDF), số người mắc bệnh tăng lên 6,3 triệu người vào năm 2045 Căn bệnh cho khơng có phân biệt màu da hay sắc tộc, triệu chứng để nhận biết giống quốc gia, vùng miền khác Điều làm nên khác biệt lối sống đặc trưng phong cách sống nơi Vì thế, nhóm bệnh nhân nghiên cứu phân loại theo chủng tộc người gốc Á, Phi, Âu, Mỹ,… tương đồng định lối sống sinh hoạt Lượng ca mắc bệnh khơng đồng đều, châu Á có tỉ lệ bệnh tăng nhanh so với giới 39 download by : skknchat@gmail.com Với liệu triệu chứng mà tác giả thu thập Bangladesh – quốc gia thuộc vùng Nam Á nên có ý nghĩa thực tiễn người bệnh gốc Á nói chung người Việt Nam nói riêng Nó đủ lực phản ánh trường hợp có khả có nguy mắc bệnh tiểu đường hay khơng, từ tổng kết lại kết Từ kết thu phần phân tích, nghiên cứu sâu để phát triển riêng cho trường hợp Việt Nam Từ đó, đủ nguồn nhân lực chuyển đổi khu vực khảo sát, nhận thêm nhiều kết thực tế Nền y học giới nói chung Việt Nam nói riêng ngày nghiên cứu, phát triển phương pháp điều trị tối ưu để kiểm soát bệnh cách tốt Đa số người giai đoạn tiền tiểu đường thường phát bệnh Vì thế, cần cảnh giác với triệu chứng âm thầm kèm theo, triệu chứng xuất phản ánh nguy mắc bệnh cao Bên cạnh đó, việc thay đổi sức khỏe tinh thần, gây ảnh hưởng đến tâm trạng điều cần lưu ý cân nhắc Hạn chế Ngoài kết mà nghiên cứu đem lại, nhiên tồn vài hạn chế Do nghiên cứu liên quan đến vấn đề y học nên tác giả chưa thực sâu vào việc giải thích lý kết hợp triệu chứng lại dự báo nguy mắc bệnh góc độ y khoa Do đó, đề tài nghiên cứu đưa kết dựa phân tích liệu với mong muốn giúp người bình thường có nhìn tổng qt bệnh dự báo tình trạng sức khỏe thân Bên cạnh đó, với liệu thu thập lấy từ nước nên kết đánh giá chung nguy người bệnh khu vực Châu Á Tuy nhiên, nghiên cứu tảng để phát triển cho khảo sát, nghiên cứu sâu Việt Nam tương lai Hướng nghiên cứu mở rộng Bài nghiên cứu “Ứng dụng khai thác liệu phân loại triệu chứng lâm sàng bệnh tiểu đường Type giai đoạn đầu (Tiền đái tháo đường) - Phân tích mức độ tác động lựa chọn mơ hình dự đốn nguy mắc bệnh” đưa triệu chứng kết hợp triệu 40 download by : skknchat@gmail.com chứng lâm sàng có nguy dẫn đến việc mắc bệnh Từ đó, xây dựng mơ hình dự báo với triệu chứng Bên cạnh đó, nghiên cứu tồn số hạn chế phần nêu Vì thế, tác giả mong muốn nghiên cứu sau đầu tư nhân lực có kiến thức chun mơn y học để thực nghiên cứu chuyên sâu hơn, giải thích kết hợp góc nhìn y khoa Tổ chức khảo sát thực tế từ bệnh viện lớn Việt Nam để thu thập nguồn số liệu nước, giúp đưa phân tích rõ ràng cụ thể Từ đó, tăng thêm độ tin cậy cho kết nghiên cứu mang lại hiệu quả, tính ứng dụng cao thực tế 41 download by : skknchat@gmail.com TÀI LIỆU THAM KHẢO Danh mục tài liệu Tiếng Việt Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008 Phân tích liệu nghiên cứu với SPSS (Tập 2), Hồ Chí Minh: Nhà xuất Hồng Đức Nguyễn Thảo Nguyên Làm quen với phần mềm khai thác liệu Clementine 12.0 Hoàng Trọng, Chu Nguyễn Mộng Ngọc, 2010 Giới thiệu Khai thác liệu Kinh Doanh, Tài liệu biên dịch từ sách tiếng Anh “Introduction to Business Data Mining” David Olson YongShi (2007) Nhà xuất McGraw-Hill Thái Bình 2020 Hơn 3,5 triệu người Việt mắc đái tháo đường tăng lên 6,3 triệu vào năm 2045 Truy cập ngày 23 tháng năm 2021, từ Đinh Hằng 2021 Tỷ lệ người Việt mắc bệnh đái tháo đường gia tăng nhanh chóng Truy cập ngày 23 tháng năm 2021, từ Đông Tây 2021 giai đoạn tiểu đường cách ngăn bệnh thành giai đoạn cuối Truy cập ngày 23 tháng năm 2021, từ Data Mining gì? Các cơng cụ khai phá liệu phổ biến Truy cập ngày 23 tháng năm 2021, từ Đông Tây 2021 Triệu chứng bệnh tiểu đường: “nhiều” bạn cần biết! Truy cập ngày 23 tháng năm 2021, từ Bigdata Uni Tổng quan Data Mining (Phần 1): Khai thác liệu gì? Truy cập ngày 23 tháng năm 2021, từ download by : skknchat@gmail.com Bigdata Uni Tổng quan Logistic regression (hồi quy Logistic) (Phần 1) Truy cập ngày 23 tháng năm 2021, từ Danh mục tài liệu Tiếng Anh Islam, MM Faniqul, et al 'Likelihood prediction of diabetes at early stage using data mining techniques.' Computer Vision and Machine Intelligence in Medical Image Analysis Springer, Singapore, 2020 113-125 II download by : skknchat@gmail.com ... ? ?Ứng dụng khai thác liệu phân loại triệu chứng lâm sàng bệnh tiểu đường Type giai đoạn đầu (Tiền đái tháo đường) - Phân tích mức độ tác động lựa chọn mơ hình dự đốn nguy mắc bệnh? ?? đưa triệu chứng. .. Mục tiêu nghiên cứu Tác giả thực đề tài ? ?Ứng dụng khai thác liệu phân loại triệu chứng lâm sàng bệnh tiểu đường Type giai đoạn đầu (Tiền đái tháo đường) - Phân tích mức độ tác động lựa chọn mơ hình... ? ?ứng thứ top bệnh khơng lây nhiễm Vì thế, tác giả thực đề tài ? ?Ứng dụng khai thác liệu phân loại triệu chứng lâm sàng bệnh tiểu đường Type giai đoạn đầu (Tiền đái tháo đường) - Phân tích mức độ

Ngày đăng: 14/04/2022, 06:13

Tài liệu cùng người dùng

Tài liệu liên quan