ỨNG DỤNG KỸ THUẬT HỌC SÂU TRONG CHẨN ĐOÁN BỆNH NGOÀI DA

50 10 1
ỨNG DỤNG KỸ THUẬT HỌC SÂU TRONG CHẨN ĐOÁN BỆNH NGOÀI DA

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tóm tắt - Kỹ thuật học sâu là hướng tiếp cận mới đang thu hút đông đảo các nhà khoa học nghiên cứu và các công ty công nghệ quan tâm. Với sự hỗ trợ về nguồn dữ liệu lớn và sức mạnh tính toán của máy tính, các mạng học sâu trở nên hiệu quả hơn, đạt được độ chính xác vượt trội so với các phương pháp truyền thống và có khả năng ứng dụng cao trong thực tế. Kỹ thuật học sâu đã cho thấy khả năng đáp ứng tốt nhiệm vụ nhận dạng cũng như hiểu được nội dung và ngữ cảnh trong đó. Kỹ thuật học sâu thực sự đã trở thành một lĩnh vực nghiên cứu tiềm năng. Tuy nhiên, có rất nhiều vấn đề thách thức trong kỹ thuật học sâu như nguồn dữ liệu huấn luyện, thời gian tính toán và độ chính xác... Trong luận văn này, chúng tôi đã nghiên cứu, xây dựng kiến trúc mạng neural nhân tạo học sâu dựa trên kiến trúc CNN và các kỹ thuật phân tích hình ảnh để nhận dạng, phân loại bệnh ngoài da từ các mẫu ảnh vùng da bất thường, đồng thời sử dụng các phương pháp tăng cường dữ liệu để cải thiện độ chính xác. Đầu tiên, mạng neural học sâu được xây dựng bằng cách sử dụng một số inceptions được sử dụng phép tích chập song song khác nhau nhằm rút ngắn thời gian xử lý. Thứ hai, tăng cường hình ảnh từ tập dữ liệu huấn luyện nhằm tạo ra dữ liệu lớn hơn đủ cho mạng neural học sâu thực hiện huấn luyện. Mục đích của nó là tránh vấn đề dữ liệu huấn luyện không đủ lớn dẫn tới kết quả kém chính xác. Kết quả đánh giá thử nghiệm trên các tập dữ liệu thực cho thấy các cách phân loại được đề xuất có độ chính xác trung bình 85,44%; có cách phân loại đối với một số bệnh có độ chính xác trên 90%. Kết quả này cho thấy rằng phương pháp đề xuất của tôi trong luận văn này có thể ứng dụng để hỗ trợ chẩn đoán bệnh, nâng cao chất lượng phát hiện bệnh, góp phần phát triển dịch vụ chăm sóc sức khỏe cộng đồng

i ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA BÙI HUY HOÀNG ỨNG DỤNG KỸ THUẬT HỌC SÂU TRONG CHẨN ĐỐN BỆNH NGỒI DA Chun ngành: KHOA HỌC MÁY TÍNH Mã số: 8480101 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC TS Hoàng Văn Dũng Đà Nẵng - Năm 2019 ii LỜI CAM ĐOAN Tôi xin cam đoan: Những nội dung luận văn thực hướng dẫn trực tiếp TS Hoàng Văn Dũng Mọi tham khảo dùng luận văn trích dẫn rõ ràng tên tác giả, tên cơng trình, thời gian, địa điểm cơng bố Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tơi xin chịu hồn tồn trách nhiệm Xin gửi lời cảm ơn đến quý thầy cô Khoa Công nghệ thông tin, Trường Đại học Bách khoa Đà Nẵng thầy giáo Trường Đại học Quảng Bình truyền đạt kiến thức quý báu cho suốt thời gian học tập vừa qua Xin chân thành cảm ơn TS Hoàng Văn Dũng tận tình hướng dẫn, truyền đạt kiến thức, kinh nghiệm cho tơi suốt q trình thực luận văn Tác giả Bùi Huy Hoàng iii MỤC LỤC LỜI CAM ĐOAN ii MỤC LỤC iii TÓM TẮT LUẬN VĂN vi DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT vii DANH MỤC CÁC BẢNG viii DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ ix MỞ ĐẦU 1 Lý chọn đề tài Mục đích ý nghĩa đề tài Mục tiêu nhiệm vụ Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Phương tiện, công cụ triển khai Cấu trúc luận văn CHƯƠNG I CƠ SỞ LÝ THUYẾT Tổng quan trí tuệ nhân tạo (Artificial intelligence) 1.1.1 Các lĩnh vực trí tuệ nhân tạo 1.1.2 Một số ứng dụng trí tuệ nhân tạo Tổng quan ảnh số kỹ thuật xử lý ảnh 1.2.1 Tổng quan ảnh 1.2.1.1 Một số khái niệm 1.2.1.2 Một số dạng ảnh 1.2.2 Một số kỹ thuật xử lý ảnh 1.2.2.1 Lược đồ ảnh (Histogram) 1.2.2.2 Nhị phân hóa ảnh 10 1.2.2.3 Làm mịn ảnh 10 1.2.2.4 Phép co ảnh - Erosion 11 Trích chọn biểu diễn đặc trưng hình ảnh 11 1.3.1 Đặc trưng ảnh 11 1.3.1.1 Đặc trưng màu sắc 11 1.3.1.2 Đặc trưng kết cấu 12 1.3.1.3 Đặc trưng hình dạng 12 1.3.2 Một số phương pháp trích chọn đặc trưng đơn giản 12 1.3.2.1 Trích chọn đặc trưng ảnh dựa màu sắc 12 iv 1.3.2.2 Trích chọn đặc trưng ảnh dựa kết cấu 12 1.3.2.3 Trích chọn đặc trưng ảnh dựa hình dạng 13 1.3.3 Mô tả đặc trưng HOG 14 1.3.3.1 Đặc trưng HOG 14 1.3.3.2 Quá trình trích rút đặc trưng HOG 14 1.3.4 Mô tả đặc trưng SIFT 18 1.3.4.1 Đặc trưng SIFT 18 1.3.4.2 Quá trình xử lý SIFT 19 1.3.4.3 Mô tả đặc trưng keypoint 22 Phương pháp phân đoạn ảnh 22 Kỹ thuật học máy 26 1.5.1 1.5.2 Tổng quan 26 Máy phân loại Vector hỗ trợ (Support Vector Machine) 27 1.5.3 Mạng neural nhân tạo 29 1.5.4 Mạng neural sâu 32 CHƯƠNG KỸ THUẬT HỌC SÂU CNN TRONG CHẨN ĐOÁN BỆNH 33 Bài tốn chẩn đốn bệnh ngồi da hình ảnh 33 2.1.1 Các nghiên cứu liên quan 33 2.1.1.1 Giới thiệu Lưu trữ ISIC 33 2.1.1.2 Tổng quan Ung thư da 33 2.1.2 Mục tiêu toán chẩn đoán bệnh 34 2.1.3 Dữ liệu chẩn đoán bệnh 35 2.1.3.1 Dữ liệu đầu vào 35 2.1.3.2 Dữ liệu đầu 36 2.1.3.3 Chứng minh tính xác 36 2.1.4 Đánh giá chẩn đoán bệnh 37 2.1.4.1 Mục tiêu số liệu 37 2.1.4.2 Số liệu khác 37 2.1.5 Chạy thử chương trình chẩn đốn bệnh 38 2.1.5.1 Xác thực 38 2.1.5.2 Kiểm tra 38 Mạng neural học sâu sử dụng nhận dạng 38 2.2.1 Giới thiệu mơ hình CNN 38 2.2.2 Cấu trúc mơ hình CNN 39 2.2.3 Hoạt động mơ hình CNN 41 2.2.4 Một số kiến trúc học sâu huấn luyện sử dụng 42 v 2.2.4.1 Mơ hình Mạng AlexNet 42 2.2.4.2 Mô hình Mạng ZFNet 44 2.2.4.3 Mơ hình mạng GoogLeNet 45 2.2.4.4 Mơ hình mạng VGG19 47 Thiết kế hệ thống học sâu chẩn đoán bệnh 48 2.3.1 Kiến trúc tổng quát 48 2.3.2 Kiến trúc học sâu dựa vào mạng Deepmind inception 49 2.3.3 Tăng cường liệu cho mạng học sâu 51 CHƯƠNG THỰC NGHIỆM, ĐÁNH GIÁ KẾT QUẢ 53 Cơ sở liệu thực nghiệm 53 Xây dựng kiến trúc học máy môi trường cài đặt 54 3.2.1 3.2.2 Xây dựng kiến trúc mạng tham số thực nghiệm 54 Môi trường cơng cụ lập trình 57 Quy trình đánh giá, phân loại liệu 58 Phân tích kết 59 Kết thực nghiệm 60 3.5.1 Kết đánh giá khối u ác tính liệu ISIC2017 60 3.5.2 Kết đánh giá loại bệnh sắc tố da liệu ISIC2018 61 Một số kết đánh giá so sánh giải pháp 65 Một số kết so sánh, đánh giá sử dụng kết hợp nhiều phương pháp 66 3.7.1 Các phương pháp trích xuất đặc trưng 66 3.7.2 Các phương pháp học máy 67 3.7.3 Phân tích kết theo kỹ thuật tiền xử lý 67 3.7.4 Phân tích kết theo đặc trưng 68 3.7.5 Phân tích kết theo kỹ thuật học máy 69 KẾT LUẬN VÀ KIẾN NGHỊ 71 Kết luận 71 Kiến nghị 71 TÀI LIỆU THAM KHẢO 72 vi TÓM TẮT LUẬN VĂN ỨNG DỤNG KỸ THUẬT HỌC SÂU TRONG CHẨN ĐỐN BỆNH NGỒI DA Học viên: Bùi Huy Hồng, Chun ngành: Khoa Học Máy Tính Mã số: 8480101 Khóa: K35, Trường Đại học Bách khoa - ĐHĐN Tóm tắt - Kỹ thuật học sâu hướng tiếp cận thu hút đông đảo nhà khoa học nghiên cứu công ty công nghệ quan tâm Với hỗ trợ nguồn liệu lớn sức mạnh tính tốn máy tính, mạng học sâu trở nên hiệu hơn, đạt độ xác vượt trội so với phương pháp truyền thống có khả ứng dụng cao thực tế Kỹ thuật học sâu cho thấy khả đáp ứng tốt nhiệm vụ nhận dạng hiểu nội dung ngữ cảnh Kỹ thuật học sâu thực trở thành lĩnh vực nghiên cứu tiềm Tuy nhiên, có nhiều vấn đề thách thức kỹ thuật học sâu nguồn liệu huấn luyện, thời gian tính tốn độ xác Trong luận văn này, nghiên cứu, xây dựng kiến trúc mạng neural nhân tạo học sâu dựa kiến trúc CNN kỹ thuật phân tích hình ảnh để nhận dạng, phân loại bệnh da từ mẫu ảnh vùng da bất thường, đồng thời sử dụng phương pháp tăng cường liệu để cải thiện độ xác Đầu tiên, mạng neural học sâu xây dựng cách sử dụng số inceptions sử dụng phép tích chập song song khác nhằm rút ngắn thời gian xử lý Thứ hai, tăng cường hình ảnh từ tập liệu huấn luyện nhằm tạo liệu lớn đủ cho mạng neural học sâu thực huấn luyện Mục đích tránh vấn đề liệu huấn luyện không đủ lớn dẫn tới kết xác Kết đánh giá thử nghiệm tập liệu thực cho thấy cách phân loại đề xuất có độ xác trung bình 85,44%; có cách phân loại số bệnh có độ xác 90% Kết cho thấy phương pháp đề xuất luận văn ứng dụng để hỗ trợ chẩn đoán bệnh, nâng cao chất lượng phát bệnh, góp phần phát triển dịch vụ chăm sóc sức khỏe cộng đồng Từ khóa - Kỹ thuật học sâu, mạng neural nhân tạo, mạng neural sâu, liệu huấn luyện TECHNICAL APPLICATION OF DEPARTMENT IN DIAGNOSIS OF OUTSIDE OF SKIN DISEASE Abstract - Deep learning technique is a new approach that is attracting a lot of research scientists and technology companies interested With the support of large data sources and computing power of computers, deep learning networks become more efficient, achieve superior accuracy compared to traditional methods and have high applicability in reality Deep learning techniques have shown the ability to respond well to the task of identification as well as understanding the content and context in it Deep learning techniques have really become a potential area of research However, there are many challenges in deep learning techniques such as training data sources, calculation time and accuracy In this thesis, we have studied and built neural network architecture artificial deep learning based on CNN architecture and image analysis techniques to identify and classify skin diseases from abnormal skin areas, and use data enhancement methods to improve degrees exactly First, deep learning neural networks are built using some inceptions that use different parallel convolution to shorten processing time Second, enhance the image from the training data set to generate data that is larger enough for deep learning neural networks to carry out training Its purpose is to avoid the problem of training data not large enough to result in inaccurate results The test evaluation results on real data sets show that the proposed classification has an average accuracy of over 80%; there is a classification for some diseases with accuracy above 90% This result shows that my proposed method in this thesis can be applied to support disease diagnosis, improve the quality of disease detection, contribute to the development of community health care services Key words - Deep learning techniques, artificial neural networks, deep neural network, training data vii DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu AI AKIEC ANN AP BB BCC BKL BRF CNN DF DNN GPU HOG HSV LBP LN LR MEL NN NV PPV ReLU RF SEN SIFT SOM SPC SVM UAC VASC Diễn giải Tiếng Anh Artificial intelligence Actinic Keratosis Artificial Neural Network Average Precision Balanced Baggin Basal cell carcinoma Benign keratosis Balanced Random Forest Convolution Neural Network Dermatofibroma Deep Neural Network Graphics Processing Unit Histogram of Oriented Gradients Hue-Saturation-Value Local Binary Pattern Linear normalization Logistic Regression Melanoma Neural Network Nevus Positive predictive value Rectified Linear Unit Random Forest Sensitivity Scale-Invariant Feature Transform Self Organizing Maps Specificity Support Vetor Machines Area Under Curve Vascular lesion Tiếng Việt Trí tuệ nhân tạo Dày sừng quang hóa (rối loạn tế bào sừng dạng tiền ung thư) Mạng neural nhân tạo Độ xác trung bình Cân đóng gói Ung thư tế bào đáy Chứng khơ sừng quang hóa Rừng ngẫu nhiên cân Mạng neural tích chập U da lành tính Mạng neural sâu Đơn vị xử lý đồ họa Biểu đồ định hướng Giá trị bảo hịa Mơ hình nhị phân cục Chuẩn hóa tuyến tính Hồi quy logistic U ác tính Mạng neural Nốt ruồi Giá trị tiên đốn tích cực Hiệu chỉnh đơn vị tuyến tính Rừng ngẫu nhiên Độ nhạy Biến đổi đặc trưng tỉ lệ không thay đổi Mạng neural tự tổ chức Độ đặc hiệu Máy vector hỗ trợ Giá trị diện tích đường cong Thương tổn mạch máu viii DANH MỤC CÁC BẢNG Bảng 2.1 Mô tả kiến trúc 25 lớp mạng AlexNet Matlab 43 Bảng 2.2 Kiến trúc mạng VGG19 48 Bảng 3.1 Kiến trúc mạng học sâu DAGNetworks với 73 lớp ẩn, lớp đầu vào lớp phân loại cuối 54 Bảng 3.2 Kết thực nhận dạng với liệu huấn luyện 2000 mẫu ảnh 60 Bảng 3.3 Ký hiệu bệnh số lượng mẫu liệu 61 Bảng 3.4 Ma trận chéo kết chẩn đoán bệnh 61 Bảng 3.5 Ma trận chéo tỷ lệ phần trăm kết chẩn đoán bệnh 62 Bảng 3.6 Kết đánh giá theo tiêu chí chẩn đốn loại bệnh da 62 Bảng 3.7 Số lượng mẫu theo bệnh 65 Bảng 3.8 Kết nhận dạng bệnh 65 Bảng 3.9 Tỷ lệ nhận dạng theo loại bệnh 65 Bảng 3.10 Phân loại AUC hiệu định nghĩa tiêu chuẩn sử dụng với phương pháp trích xuất 69 ix DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ Hình 1.1 Ảnh ký tự chữ A ma trận số vùng chọn Hình 1.2 Ma trận số biểu thị mức xám điểm ảnh Hình 1.3 Lược đồ ảnh đa mức xám kích thước 64x64 pixels Hình 1.4 Lược đồ cường độ sáng theo chiều ngang ảnh (trục Ox) Hình 1.5 Lược đồ cường độ sáng theo chiều dọc ảnh (trục Oy) 10 Hình 1.6 Minh họa phép co ảnh ảnh nhị phân 11 Hình 1.7 Ảnh nhị phân ký tự A trước sau co ảnh 11 Hình 1.8 Ảnh minh họa vector liên kết hệ số góc liên kết biên cạnh 14 Hình 1.9 Q trình trích đặc trưng HOG 15 Hình 1.10 Mẫu ảnh đầu vào chia thành cell block để tính đặc trưng HOG 15 Hình 1.11 Tính hướng độ lớn gradient 16 Hình 1.12 Tính gradient ảnh 16 Hình 1.13 Chia hướng theo bin lược đồ hướng gradient 17 Hình 1.14 Sơ đồ tổng quan trích rút đặc trưng HOG 18 Hình 1.15 Đối tượng vùng cửa sổ thay đổi co giãn ảnh 19 Hình 1.16 Tính DoG theo mức tỷ lệ tạo thành hình chóp 20 Hình 1.17 Xác định điểm cực trị dựa vào mức giá trị DoG 21 Hình 1.18 Kết minh họa tính DoG tính xác điểm cực trị 21 Hình 1.19 Mô tả đặc trưng keypoint lược đồ hướng gradient 22 Hình 1.20 Sử dụng phương pháp phân đoạn khác xử lý ảnh y tế 24 Hình 1.21 Minh họa phân cụm k-means 25 Hình 1.22 Quá trình nhận dạng đối tượng 27 Hình 1.23 Đường thẳng phân chia lớp khơng gian chiều 28 Hình 1.24 Margin SVM 28 Hình 1.25 Mơ hình ANN 30 Hình 1.26 Quá trình xử lý thông tin ANN 30 Hình 1.27 Hàm chuyển đổi 31 Hình 1.28 Mơ hình mạng neural 32 Hình 2.1 Hình ảnh số bệnh da 35 x Hình 2.2 Mơ hình mạng Neural tích chập 39 Hình 2.3 Tính tích chập với filter 39 Hình 2.4 Tính tốn với phương pháp MaxPooling 40 Hình 2.5 Hình ảnh kết ứng với 32 filter 41 Hình 2.6 Kiến trúc lớp mơ hình AlexNet 42 Hình 2.7 Kiến trúc lớp mơ hình FZNet 44 Hình 2.8 Một dạng cụ thể kiến trúc mạng GoogLeNet 46 Hình 2.9 Sơ đồ tổng quát giải pháp phân loại bệnh qua hình ảnh 49 Hình 2.10 Kiến trúc tổng thể Inception V4 50 Hình 3.1 Các hình ảnh u ác tính 53 Hình 3.2 Các hình ảnh u lành tính 53 Hình 3.3 Minh họa số mẫu bệnh chuẩn đoán 63 Hình 3.4 Minh họa số mẫu bệnh chẩn đốn nhầm 64 Hình 3.5 Sơ đồ phương pháp đánh giá 66 Hình 3.6 Kết AUC tốt phương pháp tiền xử lý hai liệu 68 Hình 3.7 Kết AUC tốt phương pháp trích xuất đặc trưng khác với phương pháp tiền xử lý trước 68 26 Thuật toán k-means chứng minh chắn hội tụ có độ phức tạp tính tốn là: O( O((n  k  d )   t ) ) Trong đó, n số đối tượng liệu, k số cụm liệu, d số chiều,  số vòng lặp, t thời gian để thực phép tính sở phép tính nhân, chia, … Như vậy, k-means phương pháp phân tích phân cụm đơn giản áp dụng tập liệu lớn Tuy nhiên, nhược điểm k-means áp dụng với liệu có thuộc tính số khám phá cụm có dạng hình cầu, k-means nhạy cảm với nhiễu phần tử ngoại lai liệu Chất lượng phân cụm liệu thuật toán k-means phụ thuộc nhiều vào tham số đầu vào số cụm k trọng tâm khởi tạo ban đầu Trong trường hợp trọng tâm khởi tạo ban đầu lệch so với trọng tâm thực cụm kết phân cụm k-means đạt thấp, nghĩa cụm liệu phân tách lệch so với cụm thực tế thời gian hội tụ chậm Kinh nghiệm cho thấy chưa có giải pháp tối ưu để chọn tham số đầu vào chung cho nhiều toán khác Giải pháp thường sử dụng thử nghiệm với giá trị đầu vào k khác sau chọn giải pháp tốt Kỹ thuật học máy 1.5.1 Tổng quan Học máy (Machine Learning) ngành khoa học nghiên cứu thuật tốn cho phép máy tính học khái niệm (concept) Có hai loại phương pháp học máy chính: - Phương pháp quy nạp: máy học phân biệt khái niệm dựa liệu thu thập trước Phương pháp cho phép tận dụng nguồn liệu nhiều sẵn có - Phương pháp suy diễn: máy học suy diễn dựa vào luật Phương pháp cho phép tận dụng kiến thức chuyên ngành để hỗ trợ máy tính Machine Learning chia thành nhánh chính: supervised learning (học có giám sát), unsupervised learning (học khơng có giám sát), reinforcement learning (học tăng cường) - Học có giám sát dùng trường hợp thuộc tính (nhãn) có sẵn cho tập liệu định (tập huấn luyện), thiếu cần dự đốn cho trường hợp khác - Học khơng có giám sát ngược lại, sử dụng trường hợp khám phá mối quan hệ tiềm ẩn tập liệu không gán nhãn (các mục không định trước) - Học tăng cường nằm loại trên, có số hình thức phản hồi có sẵn 27 cho bước tiên đốn hành động, khơng có nhãn xác thông báo lỗi[5] Trong lĩnh vực xử lý ảnh, toán phân loại mẫu nhận dạng đối tượng hiểu việc phân loại, xác định mẫu thuộc lớp cách xác dựa vào việc đo lường đối tượng dựa đặc trưng đối tượng Nói cách khác, nhận dạng đối tượng nhằm mục đích phân loại mẫu dựa kiến thức có trước đối tượng dựa vào thơng tin thống kê, đo lường trích rút từ mẫu tập liệu huấn luyện Ngày nay, nhận dạng ứng dụng rộng rãi nhiều hệ thống nhận dạng người hệ thống tương tác người mày; nhận dạng khuôn mặt định danh cá thể, nhận dạng phương tiện giao thông hệ thống giao thông thông minh, hỗ trợ lái xe; nhận dạng hành động hệ thống giám sát thông minh; nhận dạng chữ viết… Lĩnh vực nhận dạng đối tượng liên quan đến phương pháp, kỹ thuật xử lý ảnh học máy Để huấn luyện mơ hình nhận dạng đối tượng, mẫu liệu thường số hóa biểu diễn thành vector đặc trưng không gian đa chiều tương ứng, gọi không gian đặc trưng Nhờ vào vector đặc trưng để phân tích, đánh giá nhằm xây dựng mơ hình đối tượng phục vụ phân loại, nhận dạng chúng Trong nhận dạng, phương pháp học máy có giám sát không giám sát nghiên cứu ứng dụng Các kỹ thuật học máy có giám sát thường sử dụng định, mạng neural, SVM, Boosting, rừng ngẫu nhiên (random forest) Các kỹ thuật học máy không giám sát gom cụm (Clustering Algorithms), phân tích thành phần (Principal Component Analysis PCA), phân tích thành phần độc lập (Independent Component Analysis) Quá trình nhận dạng đối tượng mô tả sơ đồ tổng quát sau: Ảnh đầu vào Tiền xử lý Trích xuất đặc trưng Phân tích đặc trưng Phân loại Hình 1.22 Quá trình nhận dạng đối tượng 1.5.2 Máy phân loại Vector hỗ trợ (Support Vector Machine) Support Vector Machine (SVM) mơ hình phân loại hoạt động việc xây dựng siêu phẳng (hyperplane) có (n - 1) chiều không gian n chiều liệu cho siêu phẳng phân loại lớp cách tối ưu Nói cách khác, cho tập liệu có nhãn (học có giám sát), thuật tốn dựa liệu học để xây dựng siêu phẳng tối ưu sử dụng để phân loại liệu Ở khơng gian chiều siêu phẳng đường thẳng phân cách chia mặt phẳng không gian thành phần tương ứng lớp với lớp nằm phía đường thẳng 28 Ví dụ, ta có điểm liệu hình 1.23 với điểm thuộc lớp cho trước: Hình 1.23 Đường thẳng phân chia lớp không gian chiều Bản chất phương pháp SVM chuyển không gian liệu ban đầu thành không gian hữu hạn chiều mà cho khả phân lớp dễ dàng Một nằm mặt bàn gắn với tọa độ cụ thể Ví dụ, táo nằm cách mép trái 2cm cách mép 5cm thể trục tọa độ (x, y) tương ứng (2, 5), x y tọa độ không gian hai chiều táo Khi đưa lên chiều thứ z(x, y), ta tính tọa độ z khơng gian chiều dựa vào tọa độ x,y ban đầu Điểm làm SVM hiệu phương pháp khác việc sử dụng Kernel Method giúp cho SVM không bị giới hạn việc phân lớp cách tuyến tính, hay nói cách khác siêu phẳng hình thành từ hàm phi tuyến Margin khoảng cách siêu phẳng đến điểm liệu gần tương ứng với phân lớp Trong ví dụ táo lê đặt mặt bàn, margin khoảng cách que hai táo lê gần Điều quan trọng phương pháp SVM ln gắng cực đại hóa margin này, từ thu siêu phẳng tạo khoảng cách xa so với táo lê Nhờ vậy, SVM giảm thiểu việc phân lớp sai (misclassification) điểm liệu đưa vào Hình 1.24 Margin SVM Là kĩ thuật phân lớp phổ biến, SVM thể nhiều ưu điểm số có việc tính tốn hiệu tập liệu lớn Có thể kể thêm số ưu điểm phương pháp như: 29 - Xử lý không gian số chiều cao: SVM cơng cụ tính tốn hiệu khơng gian chiều cao, đặc biệt áp dụng cho toán phân loại văn phân tích quan điểm nơi chiều lớn - Tiết kiệm nhớ: Do có tập hợp điểm sử dụng trình huấn luyện định thực tế cho điểm liệu nên có điểm cần thiết lưu trữ nhớ dịnh - Tính linh hoạt - phân lớp thường phi tuyến tính Khả áp dụng Kernel cho phép linh động phương pháp tuyến tính phi tuyến tính từ khiến cho hiệu suất phân loại lớn Tuy nhiên SVM cho kết không tốt số lượng thuộc tính (p) tập liệu lớn nhiều so với số lượng liệu (n) Đồng việc phân lớp SVM việc cố gắng tách đối tượng vào hai lớp phân tách siêu phẳng SVM Điều chưa giải thích xác suất xuất thành viên nhóm SVM phương pháp hiệu cho tốn phân lớp liệu Nó cơng cụ đắc lực cho tốn xử lý ảnh, phân loại văn bản, phân tích quan điểm Một yếu tố làm nên hiệu SVM việc sử dụng Kernel function khiến cho phương pháp chuyển không gian trở nên linh hoạt 1.5.3 Mạng neural nhân tạo Mạng neural nhân tạo (Artificial Neural Network- ANN) mơ hình xử lý thơng tin mô dựa hoạt động hệ thống thần kinh sinh vật, bao gồm số lượng lớn neural gắn kết để xử lý thông tin ANN giống não người, học kinh nghiệm (thơng qua huấn luyện), có khả lưu giữ kinh nghiệm hiểu biết (tri thức) sử dụng tri thức việc dự đốn liệu chưa biết (unseen data) Kiến trúc chung mạng neural nhân tạo (ANN) gồm thành phần là: Input Layer, Hidden Layer Output Layer (Hình 1.25) Trong đó, lớp ẩn (Hidden Layer) gồm neural nhận liệu input từ neural lớp (Layer) trước chuyển đổi input cho lớp xử lý Trong ANN có nhiều lớp ẩn Trong Processing Elements (PE) ANN gọi neural, neural nhận liệu vào (Inputs) xử lý chúng cho kết (Output) Kết xử lý neural làm Input cho neural khác 30 Hình 1.25 Mơ hình ANN Q trình xử lý thơng tin ANN: Hình 1.26 Q trình xử lý thông tin ANN - Inputs (dữ liệu vào): Mỗi Input tương ứng với thuộc tính (attribute) liệu (patterns) - Output (kết quả): Kết ANN giải pháp cho vấn đề - Connection Weights (trọng số liên kết): Đây thành phần quan trọng ANN, thể mức độ quan trọng (độ mạnh) liệu đầu vào q trình xử lý thơng tin (quá trình chuyển đổi liệu từ layer sang layer khác) Quá trình học (Learning Processing) ANN thực trình điều chỉnh trọng số (Weights) inputs (dữ liệu vào) để có kết mong muốn - Summations Function (hàm tổng): Tính tổng trọng số tất input đưa vào Neural (phần tử xử lý PE) Hàm tổng neural n input tính theo cơng thức sau: 31 n Y   XiWi i 1 - Transfer Function (hàm chuyển đổi): Hàm tổng (Summation Function) Neural cho biết khả kích hoạt (Activation) neural cịn gọi kích hoạt bên (internal activation) Các neural sinh output khơng ANN (nói cách khác, output neural chuyển đến layer tiếp mạng neural không) Mối quan hệ Internal Activation kết (output) thể hàm chuyển đổi (Transfer Function) Hình 1.27 Hàm chuyển đổi Việc lựa chọn Transfer Function có tác động lớn đến kết ANN Hàm chuyển đổi phi tuyến sử dụng phổ biến ANN sigmoid (logical activation) function YT = 1/(1+e -Y) Trong : YT: Hàm chuyển đổi, Y: Hàm tổng Kết Sigmoid Function thuộc khoảng [0,1] nên cịn gọi hàm chuẩn hóa (Normalized Function) Kết xử lý neural (output) lớn, transfer function sử dụng để xử lý output trước chuyển đến layer Đơi thay sử dụng Transfer Function người ta sử dụng giá trị ngưỡng (Threshold value) để kiểm soát output neural layer trước chuyển output đến layer Nếu output neural nhỏ giá trị ngưỡng khơng chuyển đến layer Mạng neural có nhiều ứng dụng đạt kết định lĩnh vực trí tuệ nhân tạo Nhận dạng mẫu ứng dụng phổ biến mạng neural nhận dạng ký tự quang học, nhận dạng mặt người, nhận dạng dáng người, định danh đối tượng người qua hình ảnh, phát nhận dạng tín hiệu biển báo giao thông, phát hành động bất thường hệ thống giám sát thông minh 32 1.5.4 Mạng neural sâu Mạng neural sâu (DNN-Deep neural network) mạng neural nhân tạo với nhiều đơn vị lớp ẩn kết nối với từ lớp đầu vào tới lớp đầu ra[2] Sự khác mạng neural sâu mạng đơn giản lớp ẩn mức độ sâu mạng, tức số nút lớp số lớp ẩn lớn so với mạng neural truyền thống Nó thể qua số lớp số nút mà liệu cần phải xử lý qua trình nhận dạng hidden layer hidden layer hidden layer input layer hidden layer input layer Output layer output layer (a) (b) Hình 1.28 Mơ hình mạng neural (a) Mạng neural đơn giản với lớp ẩn (b) Mạng neural sâu kết nối đầy đủ với nhiều lớp ẩn nhiều nút Tại lớp mạng neural sâu, nút tập trung huấn luyện đặc trưng riêng biệt dựa vào kết đầu lớp trước Khi sâu vào lớp bên mạng neural, độ phức tạp đặc trưng liệu tăng lên, nút phát hiện, tổng hợp tái kết hợp đặc trưng từ lớp trước nhằm biểu diễn đặc trưng mức cao Mạng neural sâu có khả giải tập liệu lớn không gian nhiều chiều với hàng tỷ tham số cần để xử lý thông qua hàm biến đổi phi tuyến Mạng DNN có khả phát cấu trúc tiềm sở liệu không gán nhãn phi cấu trúc Trong giới thực loại liệu chiếm phần lớn Mạng neural sâu giải hiệu liệu phi cấu trúc liệu thô đa phương tiện, hình ảnh, văn bản, video, âm 33 CHƯƠNG KỸ THUẬT HỌC SÂU CNN TRONG CHẨN ĐỐN BỆNH Bài tốn chẩn đốn bệnh ngồi da hình ảnh 2.1.1 Các nghiên cứu liên quan 2.1.1.1 Giới thiệu Lưu trữ ISIC Hiệp hội hợp tác hình ảnh da quốc tế (ISIC - International skin imaging collaboration) tài trợ Hiệp hội quốc tế hình ảnh kỹ thuật số da (ISDIS) Lưu trữ ISIC chứa sưu tập lớn có sẵn hình ảnh da kiểm sốt chất lượng tổn thương da Hiện tại, Lưu trữ ISIC chứa 13.000 hình ảnh da liễu, thu thập từ trung tâm lâm sàng hàng đầu quốc tế mua từ nhiều thiết bị khác trung tâm Sự tham gia rộng rãi quốc tế đóng góp hình ảnh thiết kế để đảm bảo mẫu đại diện có liên quan mặt lâm sàng Tất hình ảnh đến Lưu trữ ISIC sàng lọc để đảm bảo quyền riêng tư đảm bảo chất lượng Hầu hết hình ảnh có liên quan đến siêu liệu lâm sàng, chuyên gia khối u ác tính cơng nhận Một tập hợp hình ảnh trải qua thích đánh dấu chuyên gia ung thư da công nhận Những dấu hiệu bao gồm đặc điểm da liễu (tức yếu tố hình thái tồn cầu tiêu điểm hình ảnh biết phân biệt loại tổn thương da) Cơ sở hạ tầng phần mềm Lưu trữ ISIC xây dựng tảng Girder mã nguồn mở mã nguồn cho lưu trữ có sẵn miễn phí GitHub1 2.1.1.2 Tổng quan Ung thư da Hơn nửa số chẩn đốn ung thư tồn giới ung thư da[9,10] Về bản, có ba loại ung thư da phổ biến ung thư tế bào đáy (BCC), ung thư tế bào vảy ung thư tế bào hắc tố Có bệnh ung thư da gặp khác, chẳng hạn ung thư da phát sinh từ tuyến mồ hôi Trong thập kỷ gần đây, tỷ lệ mắc bệnh tử vong ung thư da ngày tăng lên, trở thành vấn đề lớn sức khỏe cộng đồng Tuy nhiên, bệnh nhân phát sớm có hội chữa khỏi cao, đặc biệt, ung thư da phát giai đoạn đầu tỷ lệ chữa khỏi 90%[11] Ung thư tế bào hắc tố loại ung thư u hắc tố ác tính, nguy hiểm loại ung thư da xâm lấn sâu, di sang phận khác thể gây tử vong trường hợp ung thư khác U hắc tố ác tính có biểu ban đầu đa dạng đơn giản thường dễ bị bỏ qua tổn thương da, đến phát giai đoạn muộn, tế bào ung thư di căn, khó chữa trị U hắc tố ác tính tiến triển từ số tổn thương lành tính da nốt ruồi, Https://challenge2019.isic-archive.com/background.html 34 bớt hắc tố, u hắc tố (đồi mồi người cao tuổi), nên cần có can thiệp quan tâm đắn với tổn thương lành tính Ung thư da nói chung ung thư tế bào hắc tố nói riêng phát sớm điều trị khỏi hồn tồn, vấn đề chẩn đoán sớm ung thư da trở lên cần thiết quan trọng Phần lớn trường hợp tử vong liên quan đến ung thư da Ung thư hắc tố Ước tính năm 2018 có khoảng 91.270 trường hợp ung thư da với 9.320 trường hợp tử vong[12] Các nghiên cứu chứng minh, ung thư da bệnh điều trị chẩn đốn sớm xác Do đó, cần phải kiểm tra để phát điều trị sớm ung thư da cịn giai đoạn đầu Ánh nắng mặt trời tác nhân chủ yếu gây u hắc tố ác tính, tia cực tím gây nên biến đổi nhiễm sắc thể Hầu hết trường hợp mắc u hắc tố ác tính có tiền sử bị bỏng nắng cịn trẻ Khoảng 5% u hắc tố ác tính xuất bớt bẩm sinh, bớt bẩm sinh khổng lồ Khi tổn thương sắc tố xảy bề mặt da phát sớm cách kiểm tra trực quan chuyên gia Nó phát tự động với việc phân tích hình ảnh Với sẵn có phổ biến máy ảnh độ phân giải cao, thuật tốn cải thiện khả sàng lọc phát tổn thương da tốt Do đó, nhiều tổ chức nỗ lực nghiên cứu phân tích tự động Tuy nhiên, phối hợp so sánh tổ chức chưa thực nhiều Hiện nay, kỹ thuật nội soi da giúp loại bỏ phản chiếu bề mặt da, trực quan hóa hình ảnh da với mức độ sâu Các nghiên cứu sử dụng máy soi da, cung cấp độ xác cao cho việc chẩn đoán chuyên gia da liễu so với chụp ảnh tiêu chuẩn Khi thiết bị điện tử, điện thoại thơng minh tích hợp máy soi da hội sử dụng phần mềm đánh giá da liễu tự động điện thoại ảnh hưởng tích cực đến việc chuẩn đốn bệnh chăm sóc bệnh nhân ung thư da ngày tăng lên 2.1.2 Mục tiêu toán chẩn đoán bệnh Chẩn đốn tự động phân loại bệnh qua hình ảnh da liễu số bệnh da phổ biến như: + Nốt ruồi - Nevus + U da lành tính - Dermatofibroma + U ác tính - Melanoma + Dày sừng quang hóa - Actinic Keratosis + Chứng khơ sừng quang hóa - Benign keratosis + Ung thư tế bào đáy - Basal cell carcinoma + Tổn thương mạch máu - Vascular lesion 35 Nốt ruồi U da lành tính U ác tính Tổn thương mạch máu Dày sừng quang hóa Chứng khơ sừng quang hóa Ung thư tế bào đáy Hình 2.1 Hình ảnh số bệnh da 2.1.3 Dữ liệu chẩn đoán bệnh 2.1.3.1 Dữ liệu đầu vào Dữ liệu đầu vào hình ảnh tổn thương da liễu định dạng JPEG Tất hình ảnh tổn thương đặt tên lược đồ ISIC_.jpg, định danh gồm chữ số Thẻ EXIF ảnh bị xóa; thẻ EXIF cịn lại khơng dựa vào để cung cấp siêu liệu xác Các hình ảnh tổn thương đến từ Bộ liệu HAM10000[13] thu thập nhiều loại da liễu, từ tất vị trí giải phẫu (trừ niêm mạc móng tay), từ lịch sử số mẫu bệnh nhân sàng lọc ung thư da số tổ chức khác Hình ảnh thu thập với chấp thuận Ủy ban đánh giá đạo đức Đại học Queensland (Nghị định thư số 2017/001223) Đại học Y khoa Vienna (Nghị định thư số 1804/2017)2 Sự phân bố trạng thái bệnh đại diện cho giới thực tế sửa đổi, có nhiều tổn thương lành tính tổn thương ác tính, đại diện mức cho khối u ác tính Https://challenge2018.isic-archive.com/task3/ 36 2.1.3.2 Dữ liệu đầu Dữ liệu đáp ứng tập hợp phân loại nhị phân cho số trạng thái bệnh, cho biết chẩn đốn hình ảnh tổn thương đầu vào Tất liệu đầu mã hóa tệp CSV (giá trị phân tách dấu phẩy), với phản hồi phân loại liên tiếp Các cột tệp phải là: - IMAGE: Mẫu hình ảnh đầu vào - MEL: Chẩn đốn U ác tính - NV: Chẩn đốn Nốt ruồi - BCC: Chẩn đoán Ung thư tế bào đáy - AKIEC: Chẩn đốn Dày sừng quang hóa - BKL: Chẩn đốn Chứng khơ sừng quang hóa - DF: Chẩn đốn U da lành tính - VASC: Chẩn đốn Tổn thương mạch máu Các chẩn đoán biểu thị dạng giá trị dấu phẩy động khoảng thời gian đóng [0,0, 1,0], 0,5 sử dụng làm ngưỡng phân loại nhị phân Lưu ý phạm vi điểm ngưỡng tùy ý chuyển đổi thành phạm vi từ 0,0 đến 1,0, với ngưỡng 0,5, sử dụng chuyển đổi sigmoid sau đây: / (1 + e ^ (- (a (x - b)))) Trong x điểm ban đầu, b ngưỡng nhị phân a tham số tỷ lệ (nghĩa độ lệch chuẩn đo nghịch đảo tập liệu tổ chức) Các câu trả lời dự đoán đặt ngưỡng nhị phân b thành giá trị hệ thống phân loại dự kiến đạt độ nhạy 89%, điều không bắt buộc Giá trị độ tin cậy chẩn đốn dự đốn thay đổi độc lập, xác trạng thái bệnh thực có hình ảnh tổn thương đầu vào 2.1.3.3 Chứng minh tính xác Như chi tiết mô tả Bộ liệu HAM10000, thật chẩn đoán (được cung cấp cho huấn luyện sử dụng nội để xác thực điểm giai đoạn kiểm tra) thiết lập phương pháp sau: - Mô bệnh học - Kính hiển vi đồng tiêu phản xạ - Thương tổn khơng thay đổi q trình theo dõi da kỹ thuật số hai năm với ba hình ảnh 37 - Đồng thuận ba chuyên gia da liễu từ hình ảnh Trong tất trường hợp ác tính, chẩn đốn bệnh xác nhận mơ bệnh học 2.1.4 Đánh giá chẩn đoán bệnh 2.1.4.1 Mục tiêu số liệu Các câu trả lời dự đoán ghi cách sử dụng số xác đa lớp chuẩn hóa (cân danh mục) Các vị trí bị ràng buộc bị phá vỡ cách sử dụng vùng bên số đường cong (AUC) Cơ sở lý luận Ứng dụng lâm sàng phân loại tổn thương da cuối có hai mục tiêu: Đưa thông tin cụ thể lựa chọn điều trị cho tổn thương phát ung thư da với độ nhạy độ đặc hiệu hợp lý Nhiệm vụ cần chẩn đoán cụ thể xác số nhiều lớp, nhiệm vụ thứ hai đòi hỏi định nhị phân Trong thách thức trước ISIC, tập trung vào nhiệm vụ thứ hai, xếp hạng cho số liệu xác độ xác đa giác, gần với đánh giá thực bác sĩ da liễu Điều quan trọng nghiên cứu độc giả mở rộng, thuật toán chiến thắng so sánh với hiệu suất bác sĩ việc phân loại hình ảnh kỹ thuật số 2.1.4.2 Số liệu khác Về mặt khoa học, chẩn đốn đầu tính tốn số liệu sau cho hình ảnh: - Độ nhạy - Độ đặc hiệu - Tính xác - Khu vực đường cong (AUC) - Trung bình xác - Điểm F1 - AUC tích hợp từ độ nhạy 80% đến 100% - Giá trị tiên đốn tích cực (PPV) - Giá trị tiên đoán âm (NPV) Số liệu tổng hợp - AUC trung bình tất chẩn đốn - Chẩn đốn ác tính lành tính loại AUC 38 2.1.5 Chạy thử chương trình chẩn đoán bệnh - Tải liệu đầu vào, huấn luyện liệu - Phát triển thuật toán để tạo phân loại chẩn đốn tổn thương nói chung 2.1.5.1 Xác thực - Tải liệu đầu vào xác nhận liệu - Chạy thuật toán xác thực liệu đầu vào để tạo phản hồi dự đoán xác thực - Gửi phản hồi dự đốn xác thực, cung cấp phản hồi dự đốn có định dạng liệu xác có hiệu suất hợp lý 2.1.5.2 Kiểm tra - Tải liệu đầu vào thử nghiệm - Chạy thuật toán liệu đầu vào thử nghiệm để tạo phản ứng dự đoán thử nghiệm - Gửi phản ứng dự đốn thử nghiệm Có thể gửi tối đa thuật toán riêng biệt để đánh giá độc lập Có thể gửi khơng giới hạn, có lần gửi gần cho phương pháp sử dụng để đánh giá thức Sử dụng mơ tả ngắn gọn thuật toán - Gửi thảo mơ tả cách tiếp cận thuật tốn Mạng neural học sâu sử dụng nhận dạng 2.2.1 Giới thiệu mơ hình CNN Tải FULL (94 trang): bit.ly/2Ywib4t Dự phịng: fb.com/KhoTaiLieuAZ Mơ hình mạng neural nhân tạo truyền thẳng (feedforward neural network) đời áp dụng nhiều toán nhận dạng[4] Tuy nhiên mạng neural truyền thẳng tốt liệu hình ảnh Chính liên kết q đầy đủ tạo nên hạn chế cho mơ hình Dữ liệu hình ảnh có kích thước lớn, ảnh xám có kích thước 32×32 (pixels) cho vector đặc trưng có 1024 chiều, cịn ảnh màu kích thước 3072 chiều Điều có nghĩa cần tới 3072 trọng số θ nối lớp vào node lớp ẩn Số lượng trọng số nhân rộng số lượng node lớp ẩn tăng lên, số lượng lớp ẩn tăng lên Như với ảnh nhỏ (32×32) cần đến mơ hình đồ sộ Điều khiến cho việc thao tác với ảnh có kích thước lớn trở nên khó khăn Một điều việc liên kết cách đầy đủ điểm ảnh vào node mạng dư thừa phụ thuộc lẫn điểm ảnh xa không nhiều mà chủ yếu phụ thuộc điểm lân cận với Dựa tư tưởng mạng neural tích chập (Convolutional Neural Network) đời với kiến trúc khác so mạng truyền thẳng Thay tồn ảnh nối với node có phần cục 39 ảnh nối đến node lớp (Local connectivity) Dữ liệu hình ảnh thơng qua lớp mơ hình “học” đặc trưng để tiến hành phân lớp cách hiệu Về mơ hình mạng neural tích chập bao gồm lớp sau: lớp Convolutional, lớp RELU, lớp Pooling, lớp Fully connected Sự xếp số lượng thứ tự lớp tạo mơ hình khác phù hợp cho tốn khác Convolutio n Pooling Convolutio n Pooling Fully Connected Fully Output Predictions Connected dog (0.01) cat (0.04) boat (0.94) bird (0.02) Hình 2.2 Mơ hình mạng Neural tích chập 2.2.2 Cấu trúc mơ hình CNN - Lớp Convolutional Lớp nơi thể tư tưởng ban đầu mạng neural tích chập Thay kết nối tồn điểm ảnh, lớp sử dụng lọc (filters) có kích thước nhỏ so với ảnh (thường 3×3 5×5) áp vào vùng ảnh tiến hành tính tích chập filter giá trị điểm ảnh vùng cục Bộ filter dịch chuyển theo giá trị bước trượt (stride) chạy dọc theo ảnh quét toàn ảnh Tải FULL (94 trang): bit.ly/2Ywib4t Dự phịng: fb.com/KhoTaiLieuAZ Source pixel Hình 2.3 Tính tích chập với filter 40 Như với ảnh 32×32 filter 3×3, ta có kết ảnh có kích thước 32×32 (với điều kiện thêm padding vào ảnh gốc để tính tích chập cho trường hợp filter quét biên cạnh) kết tích chập filter ảnh Với filter lớp ta có nhiêu ảnh tương ứng mà lớp trả truyền vào lớp Các trọng số filter ban đầu khởi tạo ngẫu nhiên học dần trình huấn luyện mơ hình - Lớp RELU - rectified linear unit Lớp thường cài đặt sau lớp Convolutional Lớp sử dụng hàm kích hoạt f(x) = max(0,x) Nói cách đơn giản, lớp có nhiệm vụ chuyển toàn giá trị âm kết lấy từ lớp Convolutional thành giá trị Ý nghĩa cách cài đặt tạo nên tính phi tuyến cho mơ hình Tương tự mạng truyền thẳng, việc xây dựng dựa phép biến đổi tuyến tính khiến việc xây dựng đa tầng đa lớp trở nên vơ nghĩa Có nhiều cách để khiến mơ hình trở nên phi tuyến sử dụng hàm kích hoạt sigmoid, … hàm f(x) = max(0,x) dễ cài đặt, tính tốn nhanh mà hiệu - Lớp Pooling Lớp sử dụng cửa sổ trượt quét qua toàn ảnh liệu, lần trượt theo bước trượt (stride) cho trước Khác với lớp Convolutional, lớp Pooling khơng tính tích chập mà tiến hành lấy mẫu (subsampling) Khi cửa sổ trượt ảnh, có giá trị xem giá trị đại diện cho thông tin ảnh vùng (giá trị mẫu) giữ lại Các phương thức lấy phổ biến lớp Pooling MaxPooling (lấy giá trị lớn nhất), MinPooling (lấy giá trị nhỏ nhất) AveragePooling (lấy giá trị trung bình) Xét ảnh có kích thước 32×32 lớp Pooling sử dụng filter có kích thước 2×2 với bước trượt stride = 2, phương pháp sử dụng MaxPooling Filter duyệt qua ảnh, với lần duyệt có giá trị lớn giá trị nằm vùng cửa sổ 2×2 filter giữ lại đưa đầu Như sau qua lớp Pooling, ảnh giảm kích thước xuống cịn 16×16 (kích thước chiều giảm lần) Hình 2.4 Tính tốn với phương pháp MaxPooling ceb245a4 ... VĂN ỨNG DỤNG KỸ THUẬT HỌC SÂU TRONG CHẨN ĐỐN BỆNH NGỒI DA Học viên: Bùi Huy Hồng, Chun ngành: Khoa Học Máy Tính Mã số: 8480101 Khóa: K35, Trường Đại học Bách khoa - ĐHĐN Tóm tắt - Kỹ thuật học sâu. .. hệ thống ứng dụng hỗ trợ bác sỹ việc chẩn đoán số bệnh da Mục tiêu nhiệm vụ a Mục tiêu - Nắm vững kỹ thuật học sâu toán chẩn đoán bệnh qua ảnh chụp qua da - Đề xuất mơ hình chẩn đốn bệnh qua... cứu kỹ thuật trí tuệ nhân tạo, kỹ thuật mạng neural học sâu để ứng dụng phân tích hình ảnh chụp qua da b Phạm vi nghiên cứu Nghiên cứu đề xuất mơ hình chẩn đốn bệnh qua ảnh chụp qua da để ứng dụng

Ngày đăng: 03/12/2021, 09:48

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan