Trong nghiên cứu này đề xuất xây dựng mô hình đặc trưng có chọn lọc dùng mạng CNN EfficientNet kết hợp với “cổng quên”(Forget gate) từ ý tưởng thiết kế của LSTM trên dữ liệu ảnh bệnh lý về mắt.
Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII Nghiên cứu ứng dụng Công nghệ thông tin (FAIR), Nha Trang, ngày 8-9/10/2020 DOI: 10.15625/vap.2020.00169 KẾT HỢP ĐẶC TRƯNG DEEP LEARNING TRONG HỖ TRỢ CHẨN ĐOÁN TỰ ĐỘNG BỆNH LÝ VỀ MẮT Phạm Hoàng Oanh1, Trần Đình Tồn2, Lê Minh Hưng1, Trần Văn Lăng3 Trường Đại học Công nghệ thông tin - ĐHQG TP.HCM Trường Đại học Công nghiệp Thực phẩm TP HCM Viện Hàn lâm Khoa học Công nghệ Việt Nam 16521762@gm.uit.edu.vn, toantd@hufi.edu.vn, hunglm@uit.edu.vn, langtv@vast.ac.vn TÓM TẮT: Trong nghiên cứu đề xuất xây dựng mơ hình đặc trưng có chọn lọc dùng mạng CNN EfficientNet kết hợp với “cổng quên”(Forget gate) từ ý tưởng thiết kế LSTM liệu ảnh bệnh lý mắt Ảnh đầu vào tiền xử lý phương pháp CLAHE kết hợp với ảnh rút trích mạch máu, từ xây dựng hệ thống tự động phát bệnh phân loại bệnh lý mắt bình thường, tiểu đường, tăng nhãn áp, đục thủy tinh thể, thoái hóa điểm vàng liên quan đến tuổi, tăng huyết áp, cận thị bệnh bất thường khác cách xác nhằm giúp bác sỹ nhãn khoa bệnh nhân trình khám điều trị bệnh lý mắt Các thực nghiệm tiến hành liệu ODIR-5K, mơ hình đề xuất đạt kết với độ đo trung hòa F1-score 86,67 %, độ đồng thuận Kappa 50,54 % đạt AUC 88,57 % Từ khóa: Đáy võng mạc, bệnh mắt, kết hợp đặc trưng, học sâu I GIỚI THIỆU 1.1 Bối cảnh nghiên cứu Theo báo cáo thị giác năm 2019 Tổ chức Y tế Thế giới (WHO), có 2,2 tỷ người bị suy giảm thị lực mù Báo cáo nhấn mạnh 2,2 tỷ số cao nhiều Trong đó, tỷ người bị suy giảm thị lực ngăn chặn chưa điều trị, bao gồm người bị suy giảm thị lực mức độ trung bình nặng mù lỗi khúc xạ không điều trị (123,7 triệu), đục thủy tinh thể (65,2 triệu), tăng nhãn áp (6,9 triệu), mờ giác mạc (4,2 triệu), bệnh võng mạc tiểu đường (3 triệu) bệnh đau mắt hột (2 triệu), suy giảm thị lực cận thị không điều trị (826 triệu) [3] Hình thể tầm nhìn người mắc bệnh mắt, gây suy giảm thị lực Hình Các loại bệnh mắt ảnh hưởng đến thị lực bệnh nhân [1]: a - mắt bình thường, b - bệnh đục thủy tinh thể, c - cận thị, d - bệnh tăng nhãn áp, e - bệnh tiểu đường, f - bệnh thối hóa điểm vàng liên quan đến tuổi Hầu hết bệnh mắt ảnh hưởng đến hai mắt 80 % tất nguyên nhân gây suy giảm thị lực phòng ngừa chữa giai đoạn đầu [7] Giai đoạn muộn dẫn đến tổn thương nghiêm trọng thị lực khơng hồi phục (chẳng hạn bệnh thối hóa điểm vàng liên quan đến tuổi) Thông thường, bệnh nhãn khoa không đe dọa đến tính mạng; nhiên, theo thời gian có tác động đáng kể đến sống bệnh nhân suy giảm thị lực Do đó, nhãn khoa việc khám để sàng lọc, phát chẩn đoán sớm bệnh mắt quan trọng, giúp làm chậm q trình ngăn ngừa thị lực dẫn đến mù 1.2 Các cơng trình nghiên cứu liên quan Từ trước tới nay, cơng trình nghiên cứu bệnh mắt thực theo hướng xây dựng hệ thống chuyên gia y tế để tự động hóa q trình chuẩn đoán bệnh [8] Tuy nhiên, hệ thống chuyên gia dự đoán cách dựa trên quy tắc tĩnh xác định trước, sử dụng quy tắc tĩnh dẫn đến việc học bị hạn chế nên kết dự đốn thường khơng xác tình Với phát triển vượt bậc học máy, nghiên cứu dần chuyển sang học máy thông qua liệu đào tạo chuyên nghiệp Đã có cơng trình nghiên cứu việc phát loại bệnh mắt đục thủy tinh thể, cận thị, bệnh võng mạc tiểu đường, thối hóa điểm vàng liên quan đến tuổi bệnh tăng nhãn áp [2] Thực tế trường hợp khám lâm sàng, mắt bệnh nhân có KẾT HỢP ĐẶC TRƯNG DEEP LEARNING TRONG HỖ TRỢ CHẨN ĐOÁN TỰ ĐỘNG BỆNH LÝ VỀ MẮT 198 thể có kết hợp nhiều loại bệnh không bệnh đơn lẻ Do vậy, cần có mơ hình phân loại bệnh lý có kết hợp nhiều loại bệnh mắt Cụ thể, Hagos cộng sử dụng mạng InceptionNet-V3 cho lớp phân loại huấn luyện trước tập liệu ImageNet đạt độ xác 90,9% [9] [10] [11] Sarki cộng sử dụng mạng ResNet50, Xception Nets, DenseNets VGG với tiền xử lý ImageNet đạt độ xác tốt 81,3 % [12] Các cơng trình phân loại nhiều lớp hơn, nhiên lớp có số lượng liệu lớn, có bệnh phổ biến thường gặp mắt Để khắc phục nhược điểm trên, Islam cộng đề xuất hệ thống chẩn đoán tự động bệnh lý mắt cho lớp phân loại, bao gồm bệnh thường gặp bệnh gặp mắt, họ xuất mơ hình bao gồm cách tiền xử lý phương pháp CLAHE, sử dụng mạng tích chập (CNN) để rút trích đặc trưng sau đưa vào mạng CNN để phân loại tất bệnh, mơ hình đề xuất Islam cộng đạt kết với độ đồng thuận Kappa 31 %, độ đo AUC đạt 80,5 % độ đo trung hòa F1 score đạt 85 % [2], [6] Trong nghiên cứu này, sử dụng liệu phân loại bệnh lý khác mắt nhóm tác giả Islam để đề xuất mơ hình học máy mơ hình đặc trưng có chọn lọc dùng mạng CNN EfficientNet kết hợp với “cổng quên”(Forget gate) nhằm cải thiện độ xác phân loại bệnh 1.3 Mơ tả tốn Hình Minh họa đầu vào đầu toán Đầu vào: cặp ảnh nhãn khoa Đầu ra: phân loại bệnh mắt thành tám bệnh lý, bao gồm bình thường (N), tiểu đường (D), tăng nhãn áp (G), đục thủy tinh thể (C), thối hóa điểm vàng liên quan đến tuổi (A), tăng huyết áp (H), cận thị (M) bệnh bất thường khác (O) Chi tiết đầu vào đầu tốn thể Hình II PHƯƠNG PHÁP 2.1 Bộ liệu Trong nghiên cứu sử dụng liệu ODIR-5K [1] cung cấp từ thi Quốc tế Đại học Bắc Kinh chẩn đốn thơng minh bệnh mắt (Peking University International Competition on Ocular Disease Intelligent Recognition - ODIR2019) Bộ liệu chứa thông tin bệnh nhân thu thập Công ty TNHH Công nghệ Y tế Shanggong từ bệnh viện trung tâm y tế khác Trung Quốc Bộ liệu cung cấp để dùng cho liệu huấn luyện máy học bao gồm 7000 mẫu gán nhãn, tương tương với 3500 cặp mắt Bộ liệu dùng để kiểm thử bao gồm 1000 mẫu chưa gán nhãn, tương đương với 500 cặp mắt Vì liệu thu thập từ thực tế nên ảnh đáy mắt chụp nhiều máy ảnh y khoa khác có thị trường, chẳng hạn Canon, Zeiss Kowa, dẫn đến độ phân giải ảnh đa dạng Bộ liệu có cân số lượng lớp Cụ thể số lượng mẫu lớp bình thường (N) chiếm số lượng lớn (1140 mẫu) gấp 10 lần so với lớp tăng huyết áp (H) Chỉ có hai lớp lớp bình thường (N) lớp tiểu đường (D) có số lượng liệu lớn, lớp bệnh khác/bất thường (O), lại lớp chiếm số lượng liệu nhỏ Bên cạnh đó, lớp bệnh khác/bất thường (O) chứa 10-12 loại bệnh khác, gây khó khăn q trình phân loại Ngồi ra, mắt có bệnh đơn lẻ kết hợp nhiều bệnh 2.2 Tiền xử lý liệu 2.2.1 Phương pháp Cân biểu đồ thích ứng giới hạn độ tương phản (CLAHE) a) Cân biểu đồ (Histogram Equalization - HE) Cân biểu đồ (Histogram Equalization, viết tắt HE) phương pháp làm tăng độ tương phản toàn cục ảnh có độ tương phản thấp Một phép biến đổi phân phối lại cường độ toàn phạm vi động lực học ảnh điều có tác dụng làm tăng khác biệt đối tượng quan tâm Phạm Hoàng Oanh, Trần Đình Tồn, Lê Minh Hưng, Trần Văn Lăng 199 Cuối cùng, kênh R, kênh G tăng cường kênh B hợp với để tạo màu sắc nâng cao ảnh võng mạc b) Cân biểu đồ thích ứng (Adaptive Histogram Equalization - AHE) Cân biểu đồ thích ứng (Adaptive Histogram Equalization, viết tắt AHE) phép biến đổi HE áp dụng toàn cho tất pixel ảnh Thường vùng cục ảnh sáng tối nhiều so với vùng khác Tính tốn biến đổi HE khác cho vùng cục cải thiện độ tương phản tổng thể Kích thước ơ, kích thước vùng lân cận tham số sử dụng thuật toán Một hạn chế AHE bao quát nhiễu vùng đồng ảnh c) Cân biểu đồ thích ứng giới hạn độ tương phản (Contrast Limited Adaptive Histogram Equalization - CLAHE) Cân biểu đồ thích ứng giới hạn độ tương phản (Contrast Limited Adaptive Histogram Equalization, viết tắt CLAHE) phiên cải tiến AHE Ở khuếch đại tương phản cắt bớt để giảm vấn đề khuếch đại nhiễu Ban đầu thuật toán dùng ảnh xám ảnh X-quang, để dùng trực tiếp ảnh RGB thực ảnh kênh màu khác Trong CLAHE, ảnh đầu vào chia thành ba ảnh kênh [Đỏ (R), Xanh lục (G) Xanh lam (B)] CLAHE thực kênh G kênh hỗ trợ thơng tin cấu trúc mạch máu quan trọng Do đó, kênh G tăng cường độ tương phản Cuối cùng, kênh R, kênh G tăng cường kênh B hợp với để tạo màu sắc nâng cao ảnh võng mạc Một vài mẫu ví dụ tiến hành thực phương pháp CLAHE liệu (Hình 3) Hình Bộ liệu trước sau tiền xử lý phương pháp CLAHE 2.2.2 Phương pháp Phân đoạn mạch máu Một số bệnh lý thể người phát thông qua thay đổi hình thái hình thái mạch võng mạc [13] Phân đoạn xác mạch máu võng mạc nhiệm vụ quan trọng chẩn đoán hỗ trợ máy tính lập kế hoạch phẫu thuật cho bệnh võng mạc Mặc dù độ phân giải cao ảnh chụp ảnh đáy mắt, độ tương phản mạch máu võng mạc có xu hướng [14] Cấu trúc mạng thần kinh có nguồn gốc từ kiến trúc U-Net [15] sử dụng để phân đoạn mạch máu ảnh đáy võng mạc Đây nhiệm vụ phân loại nhị phân: mạng lưới thần kinh dự đoán pixel ảnh đáy có phải mạch máu khơng Một số mẫu ví dụ chúng tơi thực phương pháp phân đoạn mạch máu liệu (Hình 4) Hình Bộ liệu trước sau tiền xử lý phương pháp Phân đoạn mạch máu 200 KẾT HỢP ĐẶC TRƯNG DEEP LEARNING TRONG HỖ TRỢ CHẨN ĐOÁN TỰ ĐỘNG BỆNH LÝ VỀ MẮT 2.3 Gán nhãn chia liệu 2.3.1 Gán nhãn Dữ liệu gán nhãn theo cặp mắt, thông tin chi tiết tên loại bệnh lý chất lượng ảnh ghi ngơn ngữ tự nhiên (Hình 5) Do đó, cần phải xử lý liệu để bên mắt có nhãn riêng biệt Mỗi mẫu lọc theo từ khóa ghi dạng mutil-hot-vector Ví dụ mẫu có ID = sau lọc theo từ khóa mắt mẫu mắt ID=2 bên phải thể [0, 1, 0, 0, 0, 0, 0, 1] có từ khóa “laser spot”, “moderate non proliferative retinopathy” - từ khóa bệnh lớp D (bệnh tiểu đường) lớp O (các bệnh khác) Tương tự, mẫu ID=2 bên trái có dạng [0, 1, 0, 0, 0, 0, 0, 0] có từ khóa “moderate non proliferative retinopathy” từ khóa loại bệnh lớp D (Hình 6) Hình Bộ liệu ghi ngôn ngữ tự nhiên xác định theo cặp mắt Hình Bộ liệu sau gán nhãn cho mắt trái phải 2.3.2 Phân chia liệu Bộ liệu có tổng cộng 7000 mẫu, có số mẫu chất lượng ảnh trình thu thập liệu, ống kính bị mờ có bụi nên ảnh hưởng đến chất lượng mẫu rút trích đặc trưng Vì nghiên cứu chúng tơi tiến hành loại bỏ 21 mẫu có nhãn “lens dust”, “low image” khỏi tập liệu Số lượng mẫu lại 6962 mẫu Vì số lượng liệu lớp không đồng với nhau, nhằm đảm bảo trình huấn luyện (train) trình thẩm định (validation) bao gồm tất lớp chúng tơi chia liệu Hình Như vậy, số lượng liệu tổng cộng 5220 mẫu dùng tập huấn luyện 1742 mẫu dùng tập thẩm định Hình Chi tiết liệu lớp chia thành tập huấn luyện tập thẩm định 2.4 Mơ hình đề xuất 2.4.1 Hàm mát Đối với toán đa nhãn, nghiên cứu chọn hàm Binary Cross Entropy with Logits Loss (BCE With Logits Loss) để tính độ mát mơ hình đề xuất Hàm kết hợp hàm Sigmoid Binary Cross-Entropy Loss thành lớp Phiên ổn định mặt số học so với sử dụng Sigmoid Phạm Hồng Oanh, Trần Đình Tồn, Lê Minh Hưng, Trần Văn Lăng 201 Binary Cross-Entropy Loss riêng lẻ [16] Độ đo giá trị Binary Cross Entropy with Logits Loss giá trị dự đoán x giá trị thực tế y, w trọng số (nếu có), cơng thức sau: , ( ( N batch size, ( ) ) ( * ) ( ( ))-, + , ) tính theo cơng thức sau: ( ) { ( ) ( ) 2.4.2 Mơ hình mạng Các mơ hình xây dựng q rộng, sâu với độ phân giải cao Việc tăng đặc điểm giúp mơ hình học nhanh ban đầu nhanh chóng bão hịa Bên cạnh mơ hình có nhiều tham số nên phức tạp tốn chi phí tính tốn Vì vậy, Mingxing Tan [4] cộng năm 2019 đề xuất mơ hình mạng mới, mơ hình xây dựng cân cẩn thận độ sâu, chiều rộng độ phân giải mạng nên dẫn đến tham số sử dụng hiệu suất tốt Mơ hình mạng EfficientNet khuyến nghị sử dụng cho tác vụ phân lớp, mơ hình vượt qua nhiều mạng khác (như DenseNet, Inception, ResNet) điểm chuẩn ImageNet, tốc độ nhanh đáng kể Vì vậy, nghiên cứu sử dụng mơ hình mạng EfficientNet-B3 huấn luyện trước tập ảnh ImageNet Sau huấn luyện lại tồn tham số có mạng liệu xử lý phương pháp CLAHE (Thực nghiệm 1.1) phương pháp phân đoạn mạch máu (Thực nghiệm 1.2) Ban đầu, tiến hành huấn luyện tầng cuối mơ hình mạng đóng băng tầng khác Mơ hình huấn luyện epoch, batch size 32, kích thước ảnh đầu vào 240×240, learning rate 1e-5 giảm learning rate 0,75 lần sau epoch mô hình khơng cải thiện Tiếp theo, tiến hành huấn luyện tồn tham số có mơ hình mạng, mơ hình huấn luyện 15 epoch, batch size 32, kích thước ảnh đầu vào 240×240, learning rate 3e-4 giảm learning rate 0,5 lần sau epoch mơ hình khơng cải thiện 2.4.3 Kết hợp đặc trưng Sau đó, sử dụng mơ hình mạng EfficientNet huấn luyện liệu phương pháp CLAHE để rút trích liệu thành đặc trưng thứ Tương tự sử dụng mơ hình mạng EfficientNet huấn luyện liệu phương pháp phân đoạn mạch máu để rút trích thành đặc trưng thứ hai Hai đặc trưng rút trích từ mơ hình mạng EfficientNet-B3 có kích thước [1,1536,7,7] Tiếp theo cho hai đặc trưng qua tầng hợp (Adaptive average Pooling) đặc trưng có kích thước [1,1536] Nối hai đặc trưng thành đặc trưng có kích thước [1,3072] đặc trưng qua DropOut có hệ số 0,3, qua tầng Linear để phân loại đặc trưng thành lớp (Thực nghiệm 2) Tuy nhiên, dựa vào kết thu từ thực nghiệm kết khơng cao thực nghiệm 1,2 (trên ảnh CLAHE) Như vậy, việc kết hợp nhiều đặc trưng lại với khơng thể đảm bảo kết cuối tốt Một hai đặc trưng bị nhiễu độ xác bị giảm, thực nghiệm đặc trưng ảnh phân đoạn mạch máu bị nhiễu số mẫu liệu nên kết hợp với đặc trưng ảnh CLAHE kết cuối bị giảm xuống Do đó, chúng tơi tiến hành thực thực nghiệm 2.4.4 Kết hợp đặc trưng có chọn lọc Sử dụng hai đặc trưng rút trích từ mơ hình mạng EfficientNet-B3 có kích thước [1,1536] Gọi vector đặc trưng rút trích từ liệu phương pháp CLAHE phương pháp phân đoạn mạch máu x1 x2 Thực phép cộng phần tử có x1 x2, thu x có kích thước [1,1536] Vector qua hàm sigmoid Hàm sigmoid trả giá trị vector khoảng từ đến Trong đó, tượng trưng cho phần thơng tin bị “qn”, cịn tượng trưng cho tồn thơng tin giữ lại Vì dựa vào kết thực nghiệm loại liệu riêng biệt (bộ liệu xử lý phương pháp CLAHE phương pháp phân đoạn mạch máu) kết liệu xử lý phương pháp CLAHE đạt kết cao liệu xử lý phương pháp phân đoạn mạch máu Do đó, nghiên cứu chúng tơi lấy vector đặc trưng liệu xử lý phương pháp CLAHE x1 đặc trưng Sau đặc trưng qua DropOut có hệ số 0,3 nhằm giảm tượng Over fitting (là tượng mơ hình dự đốn đạt kết cao tập huấn luyện không hiệu tập kiểm thử) làm tăng tốc độ huấn luyện Cuối qua tầng Linear để phân loại đặc trưng thành lớp (Hình 8) (Thực nghiệm 3) Tám lớp đại diện cho loại bệnh mắt Tiến hành huấn luyện tồn tham số có mơ hình với epoch 20, learning rate 1e-5 batch size (vì lý tràn RAM) 202 KẾT HỢP ĐẶC TRƯNG DEEP LEARNING TRONG HỖ TRỢ CHẨN ĐOÁN TỰ ĐỘNG BỆNH LÝ VỀ MẮT Hình Chi tiết phương pháp kết hợp đặc trưng có chọn lọc 2.5 Trực quan hóa hệ thống hỗ trợ chẩn đốn bệnh lý mắt Trong nghiên cứu này, xây dựng chương trình minh họa sử dụng ngơn ngữ Python mã nguồn mở Streamlib để tạo ứng dụng Web demo hoàn thiện chạy thử nghiệm hệ thống Google Colab Người dùng yêu cầu chọn ảnh đầu vào ảnh mắt trái mắt phải để hệ thống chấn đốn bệnh (Hình 9a) Sau chọn ảnh mắt trái ảnh mắt phải vùng 1, ảnh mắt trái mắt phải sau chọn hiển thị vùng Nhấn nút "Create CLAHE & Vessel images" để tiền xử lý ảnh phương pháp CLAHE phương pháp vessel vùng (Hình 9b) Ở vùng hiển thị ảnh mắt trái xử lý CLAHE ảnh phân đoạn mạch máu, tương tự ảnh mắt phải Cuối biểu đồ thể kết dự đoán theo nhãn (Hình 9c) tương ứng loại bệnh lý mắt (a) - Chọn ảnh mắt trái mắt phải, - Tạo ảnh CLAHE ảnh vessel để dự đoán bệnh, - Vùng hiển thị ảnh đầu vào ảnh sau xử lý phương pháp CLAHE, phân đoạn mạch máu kết dự đoán (b) Phạm Hồng Oanh, Trần Đình Tồn, Lê Minh Hưng, Trần Văn Lăng 203 (c) Hình Giao diện hệ thống hỗ trợ chẩn đoán bệnh lý mắt III KẾT QUẢ THỰC NGHIỆM Chi tiết kết độ đo thực nghiệm thể Bảng Có thể thấy liệu xử lý phương pháp phân đoạn mạch máu không cho kết cao xử lý phương pháp cân biểu đồ thích ứng có giới hạn tương phản (kết ảnh phân đoạn mạch máu 0,6736 kết ảnh CLAHE 0,7345) Lý ảnh chụp có nhiễu, tác giả phương pháp phân đoạn mạch máu [17] có đề cập nhiễu ảnh hưởng đến trình rút trích đặc trưng nên cần phải xử lý liệu trước thực phương pháp phân đoạn mạch máu Và liệu ODIR2019 thu thập thực tế từ bệnh viện, trung tâm y tế nên nhiễu điều khơng tránh khỏi Cho nên có trình tiền xử lý để loại bỏ nhiễu trước huấn luyện kết tốt nhiều Thực nghiệm dựa liệu xử lý phương pháp cân biểu đồ thích ứng có giới hạn tương phản kết hợp với xử lý phương pháp phân đoạn mạch máu thực nghiệm Tuy nhiên, sau kết hợp đặc trưng có chọn lọc khơng giữ tất thơng tin có đặc trưng Với cách kết hợp này, kết thực nghiệm cao vượt trội hẳn thực nghiệm (kết thực nghiệm 0,732 kết thực nghiệm 0,7526) So sánh kết mơ hình nghiên cứu đề xuất với kết mơ hình tác giả Islam [2] nhiệm vụ, kết mơ hình chúng tơi đạt kết cao độ đo Cụ thể, mơ hình đề xuất nghiên cứu đạt kết độ đồng thuận Kappa 50,54 %, độ đo AUC đạt 88,57 %, độ đo trung hòa F1-score đạt 86,67 % cao mặt so với mơ hình tác giả Islam với độ đồng thuận Kappa 31 %, độ đo AUC đạt 80,5 % độ đo trung hòa F1-score đạt 85 % Bảng Tổng hợp kết thực nghiệm mô hình đề xuất so với mơ hình đề xuất tác giả Islam Thực nghiệm 1,1 1,2 Islam [2] Kappa 0,4618 0,3456 0,468 0,5054 0,31 AUC value 0,8822 0,8408 0,8721 0,8857 0,805 F1 score 0,8595 0,8345 0,8557 0,8667 0,85 Final 0,7345 0,6736 0,732 0,7526 0,655 Dựa vào mô hình mạng EfficientNet-B3 để rút trích đặt trưng phương pháp kết hợp đặc trưng có chọn lọc, mơ hình đề xuất đạt kết 0,7526 bảng xếp hạng thi (Hình 9) Với kết 0,7526, nghiên cứu đứng vị trí thứ 125 bảng xếp hạng Hình 10 Thứ hạng mơ hình nộp kết trang thi IV TỔNG KẾT Trong nghiên cứu đề xuất mơ hình huấn luyện kiểm thử liệu ODIR2019 cung cấp từ Cuộc thi Quốc tế Đại học Bắc Kinh Mơ hình phân loại loại bệnh với độ xác 75,26 % Bộ liệu bệnh lý mắt ODIR2019 khác với sở liệu công khai khác kết hợp thực tế lâm sàng ghi nhãn từ 204 KẾT HỢP ĐẶC TRƯNG DEEP LEARNING TRONG HỖ TRỢ CHẨN ĐOÁN TỰ ĐỘNG BỆNH LÝ VỀ MẮT bác sĩ nhãn khoa, mơ hình đề xuất có tính áp dụng thực tế so với nghiên cứu liên quan đến chẩn đoán loại bệnh lý lâm sàng mắt thực tế có Đồng thời, nghiên cứu cung cấp liệu 7000 mẫu tiền xử lý phương pháp CLAHE liệu 7000 mẫu tiền xử lý phương pháp phân đoạn mạch máu, hai liệu gán nhãn thuận tiện cho cơng trình nghiên cứu Bên cạnh đó, hệ thống hỗ trợ chẩn đốn tự động bệnh lý mắt có giao diện đơn giản, thân thiện người dùng, tốc độ xử lý cho kết chẩn đoán nhanh Trong tương lai, tiếp tục nghiên cứu phương pháp cải tiến mơ hình đề xuất để có kết với độ xác cao V LỜI CẢM ƠN Bài báo hoàn thành hỗ trợ Đề tài VAST-1.03/19-20 Viện Hàn lâm Khoa học Công nghệ Việt Nam TÀI LIỆU THAM KHẢO [1] Peking University International Competition on Ocular Disease Intelligent Recognition (ODIR-2019) https://odir2019.grand-challenge.org/dataset/ [Online; accessed 2-March-2020] [2] Islam, Md Tariqul, "Source and Camera Independent Ophthalmic Disease Recognition from Fundus Image Using Neural Network", 2019 IEEE International Conference on Signal Processing, Information, Communication & Systems (SPICSCON) IEEE, 2019 [3] WHO: World report on vision World Health Organisation (2019) https://www.who.int/publications-detail/worldreport-on-vision.[Online; accessed 15-July-2020] [4] Tan, Mingxing, Quoc V Le "Efficientnet: Rethinking model scaling for convolutional neural networks", arXiv preprint arXiv:1905.11946, 2019 [5] Ronneberger, Olaf, Philipp Fischer, Thomas Brox "U-net: Convolutional networks for biomedical image segmentation", International Conference on Medical image computing and computer-assisted intervention Springer, Cham, 2015 [6] Singla, Nidhi, Navdeep Singh, "Blood Vessel Contrast Enhancement Techniques for Retinal Images", International Journal of Advanced Research in Computer Science 8.5, 2017 [7] Flaxman, Seth R., "Global causes of blindness and distance vision impairment 1990-2020: a systematic review and meta-analysis", The Lancet Global Health 5.12: e1221-e1234, 2017 [8] Malik, Sadaf, "Data Driven Approach for Eye Disease Classification with Machine Learning", Applied Sciences 9.14: 2789, 2019 [9] Hagos, Misgina Tsighe, Shri Kant, "Transfer learning based detection of diabetic retinopathy from small dataset", arXiv preprint arXiv:1905.07203, 2019 [10] Szegedy, Christian, "Rethinking the inception architecture for computer vision", Proceedings of the IEEE conference on computer vision and pattern recognition, 2016 [11] Deng, Jia, "Imagenet: A large-scale hierarchical image database", 2009 IEEE conference on computer vision and pattern recognition IEEE, 2009 [12] Sarki, Rubina, "Convolutional neural networks for mild diabetic retinopathy detection: an experimental study", bioRxiv: 763136, 2019 [13] Jiang, Yun, "Automatic Retinal Blood Vessel Segmentation Based on Fully Convolutional Neural Networks", Symmetry 11.9: 1112, 2019 [14] Jebaseeli, T Jemima, C Anand Deva Durai, J Dinesh Peter "Extraction of retinal blood vessels on fundus images by kirsch's template and Fuzzy C-Means", Journal of medical physics 44.1: 21, 2019 [15] Ronneberger, Olaf, Philipp Fischer, Thomas Brox, "U-net: Convolutional networks for biomedical image segmentation", International Conference on Medical image computing and computer-assisted intervention Springer, Cham, 2015 [16] Akshaj Verma, Intro to Dataloaders and Loss Functions https://towardsdatascience.com/pytorch-basics-intro-todataloaders-and-loss-functions-868e86450047 [Online; accessed 12-August-2020] Feb 2020 [17] Xiancheng, Wang, "Retina blood vessel segmentation using a U-net based Convolutional neural network", Procedia Computer Science: International Conference on Data Science (ICDS 2018), Beijing, China, 2018 Phạm Hoàng Oanh, Trần Đình Tồn, Lê Minh Hưng, Trần Văn Lăng 205 INCORPORATES FEATURES DEEP LEARNING TO SUPPORT AUTOMATIC DIAGNOSIS OF EYE DISEASES Pham Hoang Oanh, Tran Dinh Toan, Le Minh Hung, Tran Van Lang ABSTRACT: In this paper, it is proposed to build a selective feature model using CNN EfficientNet network combined with "Forget gate" from the design concept of LSTM on eye image data The input image was pretreated by CLAHE method and combined with the image of an extraction of blood vessels, from which it was possible to build an automatic disease detection system and classify eye diseases such as normal, diabetes, glaucoma, cataract, age-related macular degeneration, hypertension, myopia and other diseases to help ophthalmologists and patients during their examination and treatment eye disease The experiments were conducted on the ODIR-5K dataset, the proposed model achieved results with an F1-score of 86.67 %, a Kappa consensus of 50.54 % and an AUC of 88.57 % ...KẾT HỢP ĐẶC TRƯNG DEEP LEARNING TRONG HỖ TRỢ CHẨN ĐỐN TỰ ĐỘNG BỆNH LÝ VỀ MẮT 198 thể có kết hợp nhiều loại bệnh không bệnh đơn lẻ Do vậy, cần có mơ hình phân loại bệnh lý có kết hợp nhiều... với epoch 20, learning rate 1e-5 batch size (vì lý tràn RAM) 202 KẾT HỢP ĐẶC TRƯNG DEEP LEARNING TRONG HỖ TRỢ CHẨN ĐOÁN TỰ ĐỘNG BỆNH LÝ VỀ MẮT Hình Chi tiết phương pháp kết hợp đặc trưng có chọn... 75,26 % Bộ liệu bệnh lý mắt ODIR2019 khác với sở liệu cơng khai khác kết hợp thực tế lâm sàng ghi nhãn từ 204 KẾT HỢP ĐẶC TRƯNG DEEP LEARNING TRONG HỖ TRỢ CHẨN ĐOÁN TỰ ĐỘNG BỆNH LÝ VỀ MẮT bác sĩ nhãn