Bài viết này đề xuất việc áp dụng mô hình học chuyển giao mờ trong hỗ trợ chẩn đoán bệnh. Mô hình được sử dụng dựa trên sự kết hợp giữa phương pháp học chuyển giao với tập mờ hình thành mô hình học chuyển giao mờ để giải quyết bài toán hỗ trợ chẩn đoán bệnh xơ gan.
Trần Thị Ngân Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 93 - 98 MƠ HÌNH HỌC CHUYỂN GIAO MỜ TRONG HỖ TRỢ CHẨN ĐOÁN BỆNH XƠ GAN Trần Thị Ngân1,2,3*, Nguyễn Thị Dung4, Trần Mạnh Tuấn3, Lương Thị Hồng Lan1,5 Học viện Khoa học Công nghệ - Viện hàn lâm Khoa học Công nghệ Việt Nam Viện Công nghệ thông tin - Viện hàn lâm Khoa học Công nghệ Việt Nam Trường Đại học Thủy Lợi, 4Trường Đại học Công nghệ thông tin truyền thông – ĐH Thái Nguyên Trường Đại học Sư phạm – ĐH Thái Nguyên TÓM TẮT Chẩn đoán bệnh giai đoạn quan trọng có ý nghĩa định việc điều trị bệnh nhân Chẩn đốn sớm xác giảm chi phí tăng khả chữa khỏi bệnh bệnh nhân Việc sử dụng công cụ thiết bị hỗ trợ chẩn đoán trợ giúp bác sĩ chẩn đốn nhanh xác Bài báo đề xuất việc áp dụng mơ hình học chuyển giao mờ hỗ trợ chẩn đốn bệnh Mơ hình sử dụng dựa kết hợp phương pháp học chuyển giao với tập mờ hình thành mơ hình học chuyển giao mờ để giải tốn hỗ trợ chẩn đoán bệnh xơ gan gan Nghiên cứu kiểm chứng tập liệu công bố tập liệu bao gồm 320 bệnh nhân đến khám điều trị bệnh gan bệnh viện thuộc khu vực Thái Nguyên Các kết thực nghiệm tiến hành để so sánh kết mơ hình sử dụng báo với nghiên cứu khác thời gian gần Kết thực nghiệm mô hình áp dụng báo nâng cao đáng kể độ xác chẩn đốn bệnh Từ khóa: Học chuyển giao, tập mờ, chẩn đốn bệnh, hỗ trợ chẩn đoán, bệnh gan GIỚI THIỆU* Một phần khơng thể thiếu đóng vai trò quan trọng đời sống người nhu cầu chăm sóc sức khỏe Cùng với phát triển mức sống người dân, nhu cầu khám chữa bệnh bảo vệ sức khỏe người ngày cao Thực tế nay, bệnh viện luôn tình trạng tải, nhân lực khám chữa bệnh thiết bị y tế đại không đủ để đáp ứng nhu cầu người dân Các giải pháp triển khai xây dựng bệnh viện vệ tinh; luân chuyển cán tuyến y tế sở; xây mới, mở rộng bệnh viện chưa giải tình trạng tải thực tế, nhiều bệnh viện xây khang trang người bệnh khơng tìm đến, nhiều bệnh viện vệ tinh chuyển giao kỹ thuật người bệnh địa phương vượt tuyến Lý dẫn đến tượng trình độ bác sĩ tuyến tuyến chênh lệch Trong trường hợp này, hệ thống hỗ trợ chẩn đốn bệnh cần thiết để góp phần giảm bớt tình trạng tải bệnh viện Việt Nam * Tel: 0989 040454, Email: ngantt@tlu.edu.vn Logic mờ phát triển hoàn chỉnh kết hợp với số ngành khoa học khác tạo nên sở để hình thành cơng cụ dựa cơng nghệ mờ Đóng góp logic mờ quan trọng cho lý thuyết tập mờ, hệ mờ Trong năm 2014, Kantesh Kumar OAD Xu Dezhi [1] đề xuất phương pháp tiếp cận dựa nguyên tắc mờ để dự đoán mức độ rủi ro bệnh tim mạch Sutton [2] sử dụng thuật toán K-láng giềng gần mờ (Fuzzy K-nearest neighbor - FKNN) cho toán y tế khác bao gồm chẩn đoán nha khoa Trong năm 2018, Hamido Fujita công [3] đề xuất phương pháp hỗ trợ chẩn đốn dựa trích chọn đặc trưng ảnh nha khoa Học chuyển giao mờ coi cách học hiệu để giải vấn đề cách sử dụng thông tin thu từ miền khác có liên quan để giải thích, hiểu mơi trường xung quanh lấy kiến thức từ lĩnh vực để cải thiện chế suy diễn cải thiện kết học Trong [4], Jethro Shell Simon Coupland giới thiệu phương pháp học chuyển giao mờ khả học hỏi nhiệm 93 Trần Thị Ngân Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ vụ, giữ lại thông tin chuyển giao kỹ tương tự, có sẵn người Từ kết nghiên cứu có, nhóm nghiên cứu áp dụng mơ hình kết hợp học chuyển giao suy diễn mờ hỗ trợ chẩn đoán bệnh sơ gan cho kết tốt Phần báo bố cục sau: kiến thức lý thuyết tảng trình bày phần Phần trình bày cụ thể mơ hình sử dụng toán chẩn đoán bệnh xơ gan liệu cụ thể Các kết đánh giá thực nghiệm để so sánh hiệu mơ hình áp dụng mơ hình có khác trình bày phần Cuối số kết luận trao đổi phần báo CÁC KIẾN THỨC VỀ HỌC CHUYỂN GIAO VÀ TẬP MỜ Trong phần này, mục 2.1 trình bày kiến thức học chuyển giao mục 2.2 trình bày nội dung liên quan đến suy diễn mờ Học chuyển giao Học chuyển giao (Transfer Learning) khả hệ thống nhằm phát áp dụng kiến thức kỹ học nhiệm vụ trước vào nhiệm vụ [5] Ưu điểm học chuyển giao cải thiện q trình học miền đích cách thu thập thơng tin từ miền khác có liên quan Các mơ hình học máy truyền thống thường dựa số giả định chẳng hạn yêu cầu liệu dùng trình huấn luyện kiểm tra đòi hỏi phải lấy từ khơng gian thuộc tính Học chuyển giao có khả sử dụng kiến thức nhận bước trước để cải thiện q trình học vùng thích hợp Học chuyển giao sử dụng miền thay đổi Các phương pháp học chuyển giao Học chuyển giao có lịch sử lâu dài nghiên cứu kỹ thuật tồn để giải kịch chuyển giao mô tả Sự xuất Học tập sâu sắc dẫn đến loạt 94 189(13): 93 - 98 phương pháp tiếp cận học tập chuyển tiếp Sau vài phương pháp: - Sử dụng tính đào tạo trước CNN Để thúc đẩy cách chuyển tiếp phổ biến áp dụng, phải hiểu thành cơng mạng nơron thần kinh lớn ImageNet [6] - Hiểu biết mạng nơ-ron xoắn Mặc dù nhiều chi tiết cách thức mơ hình hoạt động bí ẩn, chúng tơi biết lớp xoắn thấp chụp tính hình ảnh mức thấp, lớp xoắn cao thu nhiều chi tiết phức tạp phận thể, khuôn mặt tính khác Các lớp liên kết đầy đủ cuối thường cho nắm bắt thông tin có liên quan đến việc giải nhiệm vụ tương ứng - Học cấu trúc bên hình ảnh Một giả định tương tự sử dụng để thúc đẩy mơ hình phát sinh: Khi đào tạo mơ hình sinh ra, chúng tơi giả định khả tạo hình ảnh thực tế đòi hỏi hiểu biết cấu trúc bên hình ảnh, từ áp dụng cho nhiều tác vụ khác Giả thiết dựa vào giả thiết tất hình ảnh nằm đa tạp chiều thấp, tức có cấu trúc bên cho hình ảnh trích mơ hình Những tiến gần việc tạo hình ảnh photorealistic với mạng lưới chống đối phát triển - Học biểu diễn bất biến miền Các tính đào tạo thực tế chủ yếu sử dụng cho kịch thích ứng 3, nơi chúng tơi muốn thích nghi với nhiệm vụ Đối với trường hợp khác, cách khác để chuyển giao kiến thức học tập cho phép học đại diện không thay đổi dựa miền Những biểu thường học cách sử dụng cơng cụ tự động mã hóa denoising chứng kiến thành công việc xử lý ngôn ngữ tự nhiên [7] tầm nhìn [8] Trần Thị Ngân Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ - Tạo đại diện tương đồng Để cải thiện tính chuyển tiếp mơ tả học từ nguồn đến tên miền đích, chúng tơi muốn biểu diễn hai miền giống tốt để mơ hình khơng tính đến đặc điểm cụ thể miền cản trở việc chuyển giao phổ biến lĩnh vực Thay mã hóa tự động học số biểu diễn, chúng tơi chủ động khuyến khích đại diện hai miền giống Chúng ta áp dụng bước tiền chế biến trực tiếp cho đại diện liệu sau sử dụng đại diện để huấn luyện Chúng tơi khuyến khích đại diện tên miền mơ hình chúng tơi giống [9, 10] Một cách khác để đảm bảo tính tương tự biểu diễn hai miền gần trở nên phổ biến thêm mục tiêu khác vào mơ hình khuyến khích làm lẫn lộn hai lĩnh vực [11, 12] Sự nhầm lẫn miền phân loại thơng thường mơ hình cố gắng dự đốn miền ví dụ đầu vào Suy diễn mờ (FIS – Fuzzy Inference System) 189(13): 93 - 98 - Giao diện mờ hóa: chuyển đổi lớp đầu vào vào biên độ phù hợp với giá trị ngơn ngữ - Cơ sở trí thức bao gồm phần: Cơ sở liệu: định nghĩa hàm thuộc tập mờ sử dụng luật mờ Bộ luật: gồm luật mờ IF – THEN - Đơn vị thực thi: thực hoạt động suy diễn luật - Giao diện giải mờ: chuyển đổi giá trị kết mờ hệ suy diễn lớp đầu Các bước suy diễn mờ: - Mờ hóa biến vào: ta cần mờ hóa giá trị rõ để tham gia vào trình suy diễn - Áp dụng toán từ mờ (AND OR) cho giả thiết luật - Áp dụng phép kéo theo để tính tốn giá trị giá trị từ giả thiết đến kết luận luật - Áp dụng toán tử gộp để kết hợp kết luật thành kết cho hệ - Giải mờ kết tìm cho ta kết rõ MƠ HÌNH KẾT HỢP GIỮA HỌC CHUYỂN GIAO VỚI TẬP MỜ Phương pháp FTL chứa cấu trúc khung với thành phần nhìn thấy hình [14] Hình Sơ đồ hệ suy diễn mờ Suy diễn chế liên kết tri thức có để suy dẫn tri thức Cơ chế suy diễn phụ thuộc nhiều vào phương thức biễu diễn tri thức khơng có phương pháp suy diễn cho loại tri thức Hệ suy diễn mờ [13] chế suy diễn thường xuyên áp dụng xây dựng hệ chuyên gia Hệ suy diễn mờ tỏ hiệu trường hợp tri thức không đầy đủ, bất định khơng xác Hệ suy diễn mờ (hình 1) gồm bước sau: Hình Sơ đồ học chuyển giao mờ Trong cấu trúc có hai q trình khác biệt: chuyển khái niệm mờ mối quan hệ chúng thích nghi thành 95 Trần Thị Ngân Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ phần mờ cách sử dụng kiến thức ngữ cảnh ứng dụng Trong giai đoạn đầu tiên, hệ thống sử dụng nguồn liệu có gắn nhãn để kích hoạt q trình học tập Quá trình học tập sử dụng liệu nguồn để xây dựng FIS Cấu trúc FIS bao gồm tập mờ quy tắc mờ FIS sử dụng để nắm bắt kiến thức từ nguồn, chuyển đến nhiệm vụ mục tiêu Q trình chuyển giao thơng tin khía cạnh phương pháp FTL Giai đoạn thứ hai sơ đồ thích ứng FIS Quá trình thích ứng sử dụng kiến thức từ tập liệu nhiệm vụ không gắn nhãn với thông tin học trước Quá trình điều chỉnh thành phần riêng lẻ FIS để nắm bắt biến thể liệu Sự thay đổi biến đổi từ tình sang tình khác, hấp thụ thông qua thay đổi thực lĩnh vực tập mờ thích nghi với sở quy tắc Sử dụng cấu trúc này, phương pháp FTL hiển thị để sử dụng chuyển thông tin để giúp đỡ việc thu hẹp khoảng cách kiến thức Thơng qua q trình thích ứng trực tuyến, thơng tin tích lũy hấp thụ Về mặt phương pháp luận, giai đoạn mơ hình FTL xây dựng FIS Các quy tắc mờ tập mờ hình thành thơng qua việc sử dụng q trình Học qua liệu Ad-Hoc (ADDL- Ad-Hoc Data Driven Learning) tính từ liệu số Phương pháp sử dụng liệu số để tạo quy tắc, thủ tục dựa thuật toán đề xuất Wang-Mendel (WM) (Wang & Mendel 1992) Sơ đồ FTL xây dựng phương pháp cách bổ sung quy trình rút gọn luật Việc bổ sung phép đo tần số mờ làm giảm tác động liệu dị thường làm tăng thơng tin trích từ liệu số KẾT QUẢ THỰC NGHIỆM Trong thực nghiệm với liệu Cirrhosis bệnh nhân bác sĩ định cận 96 189(13): 93 - 98 lâm sàng với xét nghiệm cơng thức máu sinh hóa máu để chẩn đốn xơ gan Từ đánh giá xơ hóa gan cách rộng rãi, lặp lại nhiều lần viêm gan mạn, có ý nghĩa việc phát theo dõi diễn tiến bệnh, theo dõi đáp ứng mặt giảm mức độ xơ hóa sau điều trị viêm gan mạn vi-rút, bệnh gan nhiễm mỡ không rượu bệnh gan rượu Tập liệu gồm 320 bệnh nhân đến khám điều trị bệnh rối loạn men gan Bệnh viện Gang thép Thái Nguyên Bệnh Viện Đa khoa Trung ương Thái Nguyên Mỗi hồ sơ bệnh nhân chứa thông tin liên quan đến bệnh nhân đến khám điều trị bệnh rối loạn men gan Trong số 320 hồ sơ bệnh nhân gồm nhóm: nhóm gồm 150 hồ sơ bệnh nhân cho không bị xơ gan; nhóm gồm 170 hồ sơ bệnh nhân chẩn đốn xơ gan gan Các thơng tin sau trích từ hồ sơ bệnh nhân, có liên quan đến chuẩn đốn bệnh bác sĩ (một số thơng tin khác bảo vệ lý bảo mật) Các thơng tin bao gồm: tuổi tính đến ngày làm xét nghiệm (tuổi lớn 90 coi 90 tuổi); men AST hay gọi SGOT; men ALT tiểu cầu Các thông tin cấu thành thuộc tính đầu vào cho thực nghiệm Ngơn ngữ sử dụng để cài đặt thực nghiệm Matlab 2014 Các độ đo dùng để đánh giá so sánh hiệu thuật toán cài đặt báo gồm Accuracy (Acc) [15], MSE [15], MAE [16] Các phương pháp sử dụng để so sánh: suy diễn mờ (FIS) [13], Máy vector hỗ trợ (SVM-Suport Vector Machine) [17], Mạng nơ-ron min-max mờ (FMNN – Fuzzy Min-max Neural Network) [18] Bảng Kết thực nghiệm Thuật toán Acc MSE FMNN 85,94 0,928 SVM 83,56 1,437 FIS 87,00 1,132 FTL 89,31 0,892 MAE 0,895 1,234 1,038 0,873 Từ bảng 1, với độ đo Accuracy, MSE, MAE phương pháp học chuyển giao mờ tốt phương pháp SVM, FIS, FMNN Trần Thị Ngân Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ KẾT LUẬN Trong báo này, chúng tơi trình bày việc sử dụng mơ hình kết hợp phương pháp học chuyển giao với tập mờ để hỗ trợ chẩn đoán bệnh xơ gan Bài báo có số đóng góp sau: (i) vận dụng mơ hình học chuyển giao kết hợp với logic mờ toán chẩn đoán bệnh cụ thể; (ii) cài đặt thực nghiệm mơ hình kết hợp học chuyển giao với logic mờ dư thu thập thực tế bệnh viên Gang thép Thái Nguyên bệnh viên Đa khoa Thái Nguyên; (iii) Kết thực nghiệm dựa độ đo Accuracy, MSE, MAE phương pháp kết hợp nhóm áp dụng tốt so với số phương pháp khác Nghiên cứu tạo tiền đề cho việc giải số toán dự báo, hỗ trợ chẩn đoán y tế tương lai LỜI CẢM ƠN – Nghiên cứu thực tài trợ đề tài sau tiến sĩ, mã số: GUST.STS.ĐT2017- TT02 từ Học viện Khoa học Công nghệ, Viện hàn lâm Khoa học Công nghệ Việt Nam Ngồi ra, nhóm tác giả xin chân thành cảm ơn hỗ trợ hợp tác từ đơn vị phối hợp, Viện Công nghệ thông tin, Viện hàn lâm Khoa học Công nghệ Việt Nam TÀI LIỆU THAM KHẢO Oad, K K., DeZhi, X., & Butt, P K (2014), “A Fuzzy Rule Based Approach to Predict Risk Level of Heart Disease”, Global Journal of Computer Science and Technology, 14(3), pp 16-22 Ramírez, E., Castillo, O., & Soria, J (2010), “Hybrid System for Cardiac Arrhythmia Classification with Fuzzy K-Nearest Neighbors and Neural Networks Combined by a Fuzzy Inference System”, In Soft Computing for Recognition Based on Biometrics (pp 37-55) Springer Berlin Heidelberg Son L H., Tuan T M., Fujita H., Dey N., Ashour A S., Ngoc V T N., & Chu D T (2018), “Dental diagnosis from X-Ray images: An expert system based on fuzzy computing”, Biomedical Signal Processing and Control, 39, pp 64-73 Shell J., & Coupland S (2015), “Fuzzy transfer learning: methodology and application”, Information Sciences, 293, pp 59-79 189(13): 93 - 98 Pan, S J., & Yang, Q (2010), “A survey on transfer learning”, IEEE Transactions on Knowledge and Data Engineering, 22(10), pp 1345–1359 Kouw W M., Van Der Maaten L J., Krijthe J H., & Loog M (2016), “Feature-level domain adaptation”, The Journal of Machine Learning Research, 17(1), pp 5943-5974 Chen M., Xu Z., Weinberger K Q., & Sha F (2012), “Marginalized Denoising Autoencoders for Domain Adaptation”, Proceedings of the 29th International Conference on Machine Learning (ICML-12), pp 767-774 Daumé III H (2007), Frustratingly Easy Domain Adaptation, Association for Computational Linguistic (ACL), (June), 256– 263 http://doi.org/10.1.1.110.2062 Bousmalis K., Trigeorgis G., Silberman N., Krishnan D., & Erhan D (2016) Domain Separation Networks NIPS 10 Sun B., Feng J., & Saenko K (2016), “Return of Frustratingly Easy Domain Adaptation”, In Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence (AAAI-16) Retrieved from http://arxiv.org/abs/1511.05547 11 Ganin Y., & Lempitsky V (2015), “Unsupervised Domain Adaptation by Backpropagation”, In Proceedings of the 32nd International Conference on Machine Learning (Vol 37) 12 Tzeng E., Hoffman J., Zhang N., Saenko K., & Darrell T (2014), Deep Domain Confusion: Maximizing for Domain Invariance CoRR Retrieved from https://arxiv.org/pdf/1412.3474.pdf 13 Chattopadhyay S., Davis R M., Menezes D D., Singh G., Acharya R U., & Tamura T (2012), “Application of Bayesian classifier for the diagnosis of dental pain”, Journal of medical systems, 36(3), pp 1425-1439 14 Shell J., & Coupland S (2015), “Fuzzy transfer learning: methodology and application”, Information Sciences, 293, pp 59-79 15 Hyndman R J., & Koehler A B (2006), “Another look at measures of forecast accuracy”, International journal of forecasting, 22(4), pp 679-688 16 Lehmann E L., & Casella G (1998), Theory of point estimation (Vol 31) Springer Science & Business Media 17 Corinna Cortes, Vladimir Vapnik (1995), “Support-vector networks”, Machine Learning 20(3), pp 273-297 18 Tran T N., Vu D M., Tran M T., & Le B D (2018), “The Combination of Fuzzy Min–Max 97 Trần Thị Ngân Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ Neural Network and Semi-supervised Learning in Solving Liver Disease Diagnosis Support Problem”,Arabian Journal Engineering, pp 1-12 189(13): 93 - 98 for Science ABSTRACT FUZZY TRANSFER LEARNING MODEL IN CIRRHOSIS DIAGNOSIS SUPPORT Tran Thi Ngan1,2,3*, Nguyen Thi Dung4, Tran Manh Tuan3, Luong Thi Hong Lan1,5 Institute of Science and Technology – VAST, 2Institute of Information Technology – VAST, Thuyloi University, 4University of Information Technology and Communication – TNU, University of Education - TNU Disease diagnosis is a very important step in treatment process The early and accurate diagnosis will reduce the treatment cost and increase the success probability for patients Using support tools in diagnosing progress helps doctors to get faster and more precisive results In this paper, we present a novel model in disease diagnosis support This model presents the use of combination model between transfer learning and fuzzy set in cirrhosis disease diagnosis problem This model is implemented on a real data set including 320 patients from the different hospitals in Thainguyen in ordet to compare with different methods The experimental results show that the proposed model has a higher performance than other available ones This leads to the higher accuracy in disease diagnosis Keywords: Transfer learning, fuzzy set, disease diagnosis, disease diagnosis support, liver related diseases Ngày nhận bài: 12/10/2018; Ngày hoàn thiện: 19/11/2018; Ngày duyệt đăng: 30/11/2018 * Tel: 0989 040454, Email: ngantt@tlu.edu.vn 98 and ... chuyển giao với tập mờ để hỗ trợ chẩn đốn bệnh xơ gan Bài báo có số đóng góp sau: (i) vận dụng mơ hình học chuyển giao kết hợp với logic mờ toán chẩn đoán bệnh cụ thể; (ii) cài đặt thực nghiệm mơ hình. .. trình học vùng thích hợp Học chuyển giao sử dụng miền thay đổi Các phương pháp học chuyển giao Học chuyển giao có lịch sử lâu dài nghiên cứu kỹ thuật tồn để giải kịch chuyển giao mô tả Sự xuất Học. .. KHOA HỌC & CƠNG NGHỆ vụ, giữ lại thơng tin chuyển giao kỹ tương tự, có sẵn người Từ kết nghiên cứu có, nhóm nghiên cứu áp dụng mơ hình kết hợp học chuyển giao suy diễn mờ hỗ trợ chẩn đoán bệnh