(Luận văn thạc sĩ) ứng dụng mạng học sâu cho nhận biết bệnh cây bằng việc phân loại ảnh lá

132 27 0
(Luận văn thạc sĩ) ứng dụng mạng học sâu cho nhận biết bệnh cây bằng việc phân loại ảnh lá

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ NGUYỄN MINH TUẤN ỨNG DỤNG MẠNG HỌC SÂU CHO NHẬN BIẾT BỆNH CÂY BẰNG VIỆC PHÂN LOẠI ẢNH LÁ NGÀNH: KỸ THUẬT ĐIỆN TỬ - 8520203 SKC007243 Tp Hồ Chí Minh, tháng 03/2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ NGUYỄN MINH TUẤN ỨNG DỤNG MẠNG HỌC SÂU CHO NHẬN BIẾT BỆNH CÂY BẰNG VIỆC PHÂN LOẠI ẢNH LÁ NGÀNH: KỸ THUẬT ĐIỆN TỬ - 8520203 Tp Hồ Chí Minh, tháng 03 năm 2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ NGUYỄN MINH TUẤN ỨNG DỤNG MẠNG HỌC SÂU CHO NHẬN BIẾT BỆNH CÂY BẰNG VIỆC PHÂN LOẠI ẢNH LÁ NGÀNH: KỸ THUẬT ĐIỆN TỬ - 8520203 Hướng dẫn khoa học: PGS.TS NGUYỄN THANH HẢI Tp Hồ Chí Minh, tháng 03 năm 2021 Luận văn Thạc sĩ: “Ứng dụng mạng học sâu cho nhận biết bệnh việc phân loại ảnh lá” i Luận văn Thạc sĩ: “Ứng dụng mạng học sâu cho nhận biết bệnh việc phân loại ảnh lá” ii Luận văn Thạc sĩ: “Ứng dụng mạng học sâu cho nhận biết bệnh việc phân loại ảnh lá” iii Luận văn Thạc sĩ: “Ứng dụng mạng học sâu cho nhận biết bệnh việc phân loại ảnh lá” iv Luận văn Thạc sĩ: “Ứng dụng mạng học sâu cho nhận biết bệnh việc phân loại ảnh lá” v Luận văn Thạc sĩ: “Ứng dụng mạng học sâu cho nhận biết bệnh việc phân loại ảnh lá” vi Luận văn Thạc sĩ: “Ứng dụng mạng học sâu cho nhận biết bệnh việc phân loại ảnh lá” vii tương Tập ảnh gồm 12.673 mẫu gồm bốn loại bệnh Kết phân loại 99,32% Một số cơng trình khác [4-17] sử dụng cấu trúc khác mạng CNN để huấn luyện phân loại tập dự liệu hình ảnh bệnh trồng khác Ngồi ra, cịn có số cơng trình [18-20] sử dụng số mơ AlexNet, GoogleNet, Inception V3, ResNet 50 để thực huấn luyện phân loại bệnh cà chua Đó số nghiên cứu tiêu biểu liên quan đến việc nhận biết bệnh việc phân loại ảnh lá, nghiên cứu có ưu điểm nhược điểm riêng PHƯƠNG PHÁP LUẬN 2.1 Mô tả tập liệu Tập liệu PlantVillage tải từ địa http://github.com/spMohanty/PlanVillage-Dat aset Tập liệu gồm 54.306 hình ảnh loại chia thành 38 lớp nhãn, lớp nhãn loại bệnh trồng Trong gồm 10 loại bệnh cà chua, loại bệnh táo, loại bệnh bắp, loại bệnh nho, loại bệnh khoai tây, loại bệnh anh đào, loại bệnh đào, loại bệnh tiêu, loại bệnh dâu tây, loại bệnh việt quất, loại bệnh cam, loại bệnh dâu rừng, loại bệnh đậu tương, loại bệnh bí đao Trong báotập ảnh đầu vào loại bệnh khỏe cà chua lựa chọn từ tập liệu PlantVillage Mỗi loại bệnh gồm 1000 ảnh chụp dạng khác loại bệnh Tất ảnh đầu vào có kích thước [256 x 256 x3] độ sắc nét, chi tiết độ phân giải cao Tuy nhiên ảnh có dung lượng lớn làm ảnh hưởng đến tốc độ trình xử lý không phù hợp với đầu vào số mơ hình mạng Để tốc độ xử lý hình ảnh tốt định lại kích thước hình ảnh mà khơng làm ảnh hưởng đến kết xử lý Trong luận văn, tác giả sử dụng mơ hình mạng VGG16 với u cầu ảnh đầu vào phải có kích thước [224 x 224 x3], nên tất ảnh tập liệu định lại kích thước để làm ảnh đầu vào mơ hình mạng 2.2 Tiền xử lý liệu ảnh  Định lại kích cỡ ảnh (resizing images): Trong kỹ thuật xử lý ảnh, hình ảnh thu vào giữ kích thước vật lý ảnh có Bảng 1: Tập liệu bệnh cà chua đầu vào STT Hình Ảnh định lại kích cỡ  Tăng cường liệu Tăng cường liệu (data augmentation) kỹ thuật mạnh mẽ thị giác máy tính để tạo nhiều liệu huấn luyện từ liệu có sẵn Điều giúp mơ hình tổng qt hóa tốt Việc tăng cường liệu thực liệu huấn luyện (train- ing) Tăng cường liệu bao gồm số phương pháp sau đây: Xoay ảnh: Xoay ảnh phương pháp áp dụng thuật toán gần giống phép lật ảnh Từ ảnh gốc ta thực phép xoay ảnh, để tính tốn hình ảnh ta lặp lại tất điểm ảnh (pixel) in điểm ảnh tương ứng từ hình ảnh nguồn Giả sử, ta muốn xoay ảnh góc thống bảo tồn cạnh tốt “khối” cạnh Các pixel nội suy sau: =a x 00 i,j i,j x11 = MEDIAN x 01 = MEDIAN  i,j i,j  điểm nằm tọa độ ( x p , yp ) hình = MEDIAN x10 ảnh tương ứng với điểm (x, y) hình ảnh đầu vào tính theo cơng thức: Trong “ ◊ ” toán tử nhân rộng x p = x ∗ cos(α ) − y ∗sin(α) 2.3 Cấu trúc mạng nơ -ron tích chập i,j Gồm lớp bản: y p = x ∗ sin(α ) + y ∗cos(α) Nếu điểm ( x p , yp ) nằm ngồi hình ảnh đầu vào, bị bỏ qua (điểm ảnh đen) Điều sử dụng để thực phép quay, nhiên, tâm phép quay tọa độ (0, 0) Để thay đổi tọa độ tâm quay, cần dịch chuyển tọa độ trước quay sau quay theo công thức; x p = ( x − xc ) * cos(α ) − ( y − yc ) *sin(α) + xc Lớp tích chập: Lớp sử dụng lọc kích thước nhỏ qt qua tồn ảnh Mỗi lần dịch chuyển theo giá trị bước trượt Tại bước, lọc tiến hành tích chập với điểm ảnh vùng ảnh Ta cũng dùng nhiều lọc khác lên ảnh đầu vào để tìm nhiều đặc trưng ảnh Giả sử lọc w có kích thước m x n tích chập với ảnh đầu vào f(x,y) cho ngõ g(x,y) vớ i công thứ c sau: m −1 n −1 y p = ( x − xc ) *sin(α ) + ( y − yc ) * cos(α) + yc g(x, y) = ∑ ∑w(s,t) f (x + s, y + t) s =0 (2 ) Lật ảnh (hiệu ứng gương) thực cách đảo ngược điểm ảnh theo chiều ngang chiều dọc Khi ta thực phép lật ngang, điểm ảnh nằm tọa độ (x,y) hình ảnh gốc nằm tọa độ ( xw −1, y) hình ảnh Phóng to hình ảnh: tác vụ quan trọng sử dụng nhiều ứng dụng, bao gồm World Wide Web, video kỹ thuật số, DVD hình ảnh khoa học Khi phóng to, pixel chèn vào hình ảnh để mở rộng kích thước hình ảnh nhiệm vụ nội suy pixel xung quanh pixel ban đầu trọng số trung bình áp dụng cho vấn đề tương tự yêu cầu nội suy Ưu điểm việc sử dụng trung vị có trọng số nội suy so với phương pháp tuyến tính truyền (4) t =0 Lớp hiệu chỉnh tuyến tính (ReLU): ReLU hàm phi tuyến tính, chức lớp chuyển toàn giá trị âm từ kết lớp tích chập thành giá trị 0, nghĩa Output = max(0,Input) Đầu lớp ReLU có kích thước giống với đầu vào, tất giá trị âm loại bỏ Lớp Pooling: Sau qua lớp Pooling, ảnh giảm kích thước giữ đặc trưng quan trọng ảnh Khác với lớp tích chập, lớp tiến hành lấy mẫu (subsampling) thay tích chập Lớp Pooling lấy mảng nhỏ (filter kích thước 2x2 3x3) từ lớp chập tạo mẫu đặc trưng cho Trong lớp Pooling phương pháp Max Pooling áp dụng cho liệu ngõ vào này, chọn giá trị lớn từ cửa sổ Lớp kết nôi đầy đủ: mạng nơ-ron nhiều tầng sử dụng chức kích hoạt softmax lớp đầu Kết nối đầy đủ có nghĩa nơ-ron lớp trước kết nối với nơ-ron lớp Theo hệ thống mạng có lớp sau:  input: ngõ vào ảnh cần phân loại với  Hàm Softmax: hàm lấy vectơ số thực chuẩn hóa thành phân phối xác suất bao gồm xác suất theo tỷ lệ số mũ số đầu vào σ i  j =1 Với f ngõ vào có kích thước k x l, 1≤ i ≤C, C số lớp đào tạo Lớp ngõ ra: vector biểu diễn lớp định nghĩa hình ảnh ngõ vào Trong nghiên cứu này, vector bao gồm liệu đại diện cho tập bệnh cà chua cần phân loại   2.4 Mơ hình mạng CNN VGG-16 Mơ hình mạng nơ-ron tích chập VGG-16 [17] mơ hình đào tạo nhóm VGG Oxford    Conv: Convolutions FC: Fully Connected Hình Mơ hình mạng VGG-16 Trong nghiên cứu này, sử dụng để tìm hiểu cấu trúc chi tiết mạng nơ-ron tích chập ứng dụng cho phân loại bệnh cà chua kích cỡ chọn 224x224x3, cũng ngõ vào mạng conv1_1: lớp tích chập, sử dụng 64 lọc với lọc có kích thước 3x3 pixels, stride padding (tạo đường viền áp lên ngõ vào), liệu ngõ lớp có kích cỡ 224 x 224 x 64 Theo đó, ta có (3 x x 3) x 64 = 1728 trọng số 64 bias, tổng cộng số lượng tham số (trọng số bias) 1792 Lớp relu1_1 hàm kích hoạt ReLU conv1_2: lớp tích chập, sử dụng 64 lọc với kích thước 3x3 pixels, stride padding 1, liệu ngõ lớp có kích cỡ 224 x 224 x 64 Theo đó, ta có (3 x x 64) x 64 = 36864 trọng số 64 bias, tổng cộng số lượng tham số 36928 Lớp relu1_2 hàm kích hoạt ReLU pool1: lớp max pooling với kích thước cửa sổ 2×2 stride 2, liệu ngõ lớp có kích cỡ 112 x 112 x 64 conv2_1: lớp tích chập, sử dụng 128 lọc với kích thước 3x3 pixels, stride padding 1, liệu ngõ lớp có kích cỡ 112 x 112 x 128 Theo đó, ta có (3 x x 64) x 128 = 73728 trọng số 128 bias, tổng cộng số lượng tham số 73856 Lớp relu2_1 hàm kích hoạt ReLU conv2_2: lớp tích chập, sử dụng 128 lọc với kích thước 3x3 pixels, stride padding 1, liệu ngõ lớp có kích cỡ 112 x 112 x 128 Theo đó, ta có (3 x x 128) x 128 = 147456 trọng số 128 bias, tổng cộng số lượng tham số 147584 Lớp relu2_2 hàm kích hoạt ReLU pool2: lớp max pooling với kích thước cửa sổ 2×2 stride 2, liệu ngõ lớp có kích cỡ 56 x 56 x 128 conv3_1: lớp tích chập, sử dụng 256 lọc với kích thước 3x3 pixels, stride padding 1, liệu ngõ lớp có kích cỡ 56 x 56 x 256 Theo đó, ta có (3 x       x 128) x 256 = 294912 trọng số 256 bias, tổng cộng số lượng tham số 295168 Lớp relu3_1 hàm kích hoạt ReLU conv3_2: lớp tích chập, sử dụng 256 lọc với kích thước 3x3 pixels, stride padding 1, liệu ngõ lớp có kích cỡ 56 x 56 x 256 Theo đó, ta có (3 x x 256) x 256 = 589824 trọng số 256 bias, tổng cộng số lượng tham số 590080 Lớp relu3_2 hàm kích hoạt ReLU conv3_3: lớp tích chập, sử dụng 256 lọc với kích thước 3x3 pixels, stride padding 1, liệu ngõ lớp có kích cỡ 56 x 56 x 256 Theo đó, ta có (3 x x 256) x 256 = 589824 trọng số 256 bias, tổng cộng số lượng tham số 590080 Lớp relu3_3 hàm kích hoạt ReLU pool3: lớp max pooling với kích thước cửa sổ 2×2 stride 2, liệu ngõ lớp có kích cỡ 28 x 28 x 256 conv4_1: lớp tích chập, sử dụng 512 lọc với kích thước 3x3 pixels, stride padding 1, liệu ngõ lớp có kích cỡ 28 x 28 x 512 Theo đó, ta có (3 x x 256) x 512 = 1179648 trọng số 512 bias, tổng cộng số lượng tham số 1180160 Lớp relu4_1 hàm kích hoạt ReLU conv4_2: lớp tích chập, sử dụng 512 lọc với kích thước 3x3 pixels, stride padding 1, liệu ngõ lớp có kích cỡ 28 x 28 x 512 Theo đó, ta có (3 x x 512) x 512 = 2359296 trọng số 512 bias, tổng cộng số lượng tham số 2359808 Lớp relu4_2 hàm kích hoạt ReLU conv4_3: lớp tích chập, sử dụng 512 lọc với kích thước 3x3 pixels, stride padding 1, liệu ngõ lớp có kích cỡ 28 x 28 x 512 Theo đó, ta có (3 x x 512) x 512 = 2359296 trọng số 512 bias, tổng cộng số lượng tham số 2359808 Lớp relu4_3 hàm kích hoạt ReLU  pool4: lớp max pooling với kích thước        cửa sổ 2×2 stride 2, liệu ngõ lớp có kích cỡ 14 x 14 x 512 conv5_1: lớp tích chập, sử dụng 512 lọc với kích thước 3x3 pixels, stride padding 1, liệu ngõ lớp có kích cỡ 14 x 14 x 512 Theo đó, ta có (3 x x 512) x 512 = 2359296 trọng số 512 bias, tổng cộng số lượng tham số 2359808 Lớp relu5_1 hàm kích hoạt ReLU conv5_2: lớp tích chập, sử dụng 512 lọc với kích thước 3x3 pixels, stride padding 1, liệu ngõ lớp có kích cỡ 14 x 14 x 512 Theo đó, ta có (3 x x 512) x 512 = 2359296 trọng số 512 bias, tổng cộng số lượng tham số 2359808 Lớp relu5_2 hàm kích hoạt ReLU conv5_3: lớp tích chập, sử dụng 512 lọc với kích thước 3x3 pixels, stride padding 1, liệu ngõ lớp có kích cỡ 14 x 14 x 512 Theo đó, ta có (3 x x 512) x 512 = 2359296 trọng số 512 bias, tổng cộng số lượng tham số 2359808 Lớp relu5_3 hàm kích hoạt ReLU pool5: lớp max pooling với kích thước cửa sổ 2×2 stride 2, liệu ngõ lớp có kích cỡ x x 512 fc6: lớp kết nối đầy đủ có 4096 nơron Theo đó, ta có 4096 x 25088 = 102760448 trọng số 4096 bias, tổng cộng số lượng tham số 102764544 Lớp relu6 hàm kích hoạt ReLU drop6: drop out áp dụng với tỉ lệ 0.5, tức có 50% nơ-ron lớp fc6 bị tắt trình huấn luyện, nhằm hạn chế tượng khớp (overfitting) vốn nhược điểm lớn mạng nơ-ron nhân tạo fc7: lớp kết nối đầy đủ thứ hai có 4096 nơron Theo đó, ta có 4096 x 4096 = 16777216 trọng số 4096 bias, tổng cộng số lượng tham số 16781312 Lớp relu7 hàm kích hoạt ReLU  drop7: drop out 50% số node mạng liên kết lớp fc7  fc8: lớp kết nối đầy đủ cuối có số nơ-ron tương ứng với số danh tính cần phân loại Đi với hàm kích hoạt softmax Ví dụ ta có đối tượng cần phân loại ngõ số nơ-ron lớp Theo đó, ta có x 4096 = 32768 trọng số bias, tổng cộng lại số lượng tham số 32776  classoutput : lớp phân loại tính tốn tổn thất cross entropy cho vấn đề phân loại đa lớp với lớp loại trừ lẫn 2.5 Thuật toán ưu dùng huấn luyện  Thuật toán lan truyền bình phương trung bình bậc hai Thuật tốn lan truyền bình phương trung bình bậc hai (RMSProp) [21] phương pháp tỷ lệ học tập thích ứng đề xuất Geoffrey Hinton Thuật toán giữ trung bình di động bình phương phần tử tham số độ dốc phương pháp khác để tính tốn tỷ lệ học tập thích ứng cho tham số Ngồi việc giữ trung bình phân rã theo cấp số nhân bình phương độ dốc q khứ vt , cũng giữ mức trung bình phân rã theo cấp số nhân độ dốc khứ mt : mt = β1mt −1 + (1− β1 )gt (8) vt = β2vt −1 + (1− β2 )gt mt vt ước lượng mô men (giá trị trung bình) mơ men thứ hai (phương sai khơng kiểm sốt) độ dốc tương ứng Những bias thêm vào để điều chỉnh sai lệch ước lượng mô men thứ thứ hai mˆ = mt 1− β t t (9) vˆ = E[g ] t t E[g] trung bình di chuyển bình phương độ dốc, gt độ dốc hàm chi phí trọng số, η tỷ lệ học tập β tham số trung bình di chuyển (giá trị mặc định thường 0,9) Thuật tốn sử dụng trung bình di động để chuẩn hóa cập nhật tham số riêng lẻ θ =θ t +1 vt 1− β2t Và cuối ta có quy tắc cập nhật cho thuật tốn: θt+1 =θt − Thơng thường cho β1 = 0,9, β2 = 0,999, ε = t -8 10 KẾT QUẢ VÀ THẢO LUẬN 3.1 Kết huấn luyện mạng Sử dụng thuật tốn có hiệu làm giảm tốc độ học tập tham số với độ dốc lớn tăng tốc độ học tập tham số với độ dốc nhỏ, ɛ số nhỏ bổ sung vào để mẫu tránh  Ước lượng mơ men thích ứng Ước lượng mơ men thích ứng (Adam) [22] Việc huấn luyện mạng thực 10 epoch tập liệu bệnh cà chua Kết thể qua biểu đồ xác lỗi tương ứng  Kết huấn luyện loại bệnh cà chua Kết độ xác mơ hình 98.00% Thời gian hồn thành q trình huấn luyện 1075 phút thể hình Trong biểu đồ Accuracy_đường màu xanh dương độ xác q trình huấn luyện, phân loại xác phần nhỏ, đường nét đứt màu đen thể độ xác tập kiểm tra Và biểu đồ Loss, đường màu đỏ cam lỗi phần nhỏ, đường nét đứt màu đen lỗi tập kiểm tra  Kết huấn luyện loại bệnh cà chua: Kết độ xác mơ hình 85.45% Thời gian hồn thành q trình huấn luyện 2804 phút 56 giây thể hình Trong biểu đồ Accuracy_đường màu xanh dương độ xác q trình huấn luyện, phân loại xác phần nhỏ, đường nét đứt màu đen thể độ xác tập kiểm tra Và biểu đồ Loss, đường màu đỏ cam lỗi phần nhỏ, đường nét đứt màu đen lỗi tập kiểm tra Hình Biểu đồ huấn luyện 10 epoch loại bệnh cà chua  Kết huấn luyện loại bệnh cà chua: Kết độ xác mơ hình 92.20% Thời gian hồn thành q trình huấn luyện 1832 phút 52 giây thể hình Trong biểu đồ Accuracy_đường màu xanh dương độ xác q trình huấn luyện, phân loại xác phần nhỏ, đường nét đứt màu đen thể độ xác tập kiểm tra Và biểu đồ Loss, đường màu đỏ cam lỗi phần nhỏ, đường nét đứt màu đen lỗi tập kiểm tra Hình Biểu đồ huấn luyện 10 epoch loại bệnh cà chua  Kết huấn luyện loại bệnh cà chua (tập ảnh lá được phân đoạn tách khỏi nền): Kết độ xác mơ hình 80.94% Thời gian hồn thành q trình huấn luyện 3144 phút 37 giây thể hình Trong biểu đồ Accuracy_đường màu xanh dương độ xác q trình huấn luyện, phân loại xác phần nhỏ, Hình Biểu đồ huấn luyện 10 Hình Biểu đồ huấn luyện 10 epoch epoch loại bệnh cà chua loại bệnh cà chua (ảnh tách khỏi nền) đường nét đứt màu đen thể độ xác tập kiểm tra Và biểu đồ Loss, đường màu đỏ cam lỗi phần nhỏ, đường nét đứt màu đen lỗi tập kiểm tra Như qua biểu đồ huấn luyện cho thấy hiệu suất phân loại bị ảnh hưởng trường hợp có số loại tập bệnh khác nhau, huấn luyện số loại tập bệnh nhiều hiệu suất phân loại giảm Trong hình 7, trục ngang thể trường hợp huấn luyện với tập bệnh, tập bệnh, tập bệnh tập bệnh tách khỏi nền, trục đứng thể độ xác (%) Cụ thể kết sau: với loại tập bệnh hiệu suất cao 98,00%, loại tập bệnh hiệu suất 92,20%, loại tập bệnh hiệu suất 85,45%, thấp tập bệnh tách hiệu suất đạt 80,94% Hình Biểu đồ so sánh độ xác phân loại tập liệu Hình :Biểu đồ so sánh thời gian huấn luyện tập liệu Đối với thời gian huấn luyện cũng có thay đổi tương ứng, trường họp số tập bệnh nhiều thời gian huấn luyện lâu Trong hình trục ngang thể trường hợp huấn luyện với tập bệnh, tập bệnh, tập bệnh tập bệnh tách khỏi nền, trục đứng thể thời gian huấn luyện (phút) Kết cụ thể sau: với loại tập bệnh thời gian nhanh 1075 phút, loại tập bệnh thời gian 1832 phút, loại tập bệnh thời gian 2804 phút, lâu tập bệnh tách thời gian 3144 phút 3.2 Kết phân loại Để đánh giá độ xác kết phân loại sử dụng ma trận nhầm lẫn ( confusion matrix) để thể Trong hình 9, hàng tương ứng với lớp dự đoán (Output Class) cột tương ứng với lớp mục tiêu (Target Class) Các ô chéo màu xanh tương ứng với phân loại xác, ngồi đường chéo tương ứng với phân loại khơng xác Cột phía bên phải ma trận Preci-sion-tỷ lệ phần trăm tất mẫu dự đốn lớp phân loại xác (chữ xanh) khơng xác (chữ đỏ) Hàng ma trận Recal-tỷ lệ phần trăm tất mẫu lớp phân loại xác khơng xác Ơ bên phải ma trận độ xác tổng thể (Accuracy) dùng đề đánh giá báonày Trong hình 9(a) đánh giá độ xác phân loại tập bệnh với 3000 mẫu liệu cho lớp 600 mẫu liệu xem xét để kiểm tra hiệu suất hệ thống Trong số 600 mẫu này, 12 phân loại sai gồm mẫu liệu lớp bị phân loại sai, mẫu liệu lớp bị phân loại sai, tất mẫu lớp phân loại Do đó, độ xác phân loại cho lớp 98,5%, lớp 95,5%, lớp 100%, trung bình phân loại 98% Trong hình 9(b) đánh giá độ xác phân loại tập bệnh với 5000 mẫu liệu cho lớp 1000 mẫu liệu xem xét để kiểm tra hiệu suất hệ thống Trong số 1000 mẫu này, 78 phân loại sai gồm mẫu liệu lớp bị phân loại sai, 36 mẫu liệu lớp bị phân loại sai, mẫu liệu lớp bị phân loại sai, 15 mẫu liệu lớp bị phân loại sai,và 11 mẫu liệu lớp bị phân loại sai Do đó, độ xác phân loại cho lớp 95,5%, lớp 82,0%, lớp 96,5%, lớp 92,5%, lớp 94,5%, trung bình phân loại 92,2% 78,0%, lớp 86,5%, lớp 93,5%, lớp 75,0%, lớp 94,5%, trung bình phân loại 80,9% 3.3 Đánh giá mơ hình CNN VGG16 Hình Đánh giá độ xác ma trận nhầm lẫn Trong hình 9(c) đánh giá độ xác phân loại tập bệnh với 8000 mẫu liệu cho lớp 1600 mẫu liệu xem xét để kiểm tra hiệu suất hệ thống Trong số 1600 mẫu này, 227 phân loại sai gồm 27 mẫu liệu lớp bị phân loại sai, 58 mẫu liệu lớp bị phân loại sai, 16 mẫu liệu lớp bị phân loại sai, 36 mẫu liệu lớp bị phân loại sai, 28 mẫu liệu lớp bị phân loại sai, 28 mẫu liệu lớp bị phân loại sai, 20 mẫu liệu lớp bị phân loại sai, 14 mẫu liệu lớp bị phân loại sai Do đó, độ xác phân loại cho lớp 86,5%, lớp 63,7%, lớp 92,0%, lớp 82,0%, lớp 86,0%, lớp 86,0%, lớp 90,0%, lớp 93,0%, trung bình phân loại 85,4% Trong hình 9(d) đánh giá độ xác phân loại tập bệnh tách với 8000 mẫu liệu cho lớp 1600 mẫu liệu xem xét để kiểm tra hiệu suất hệ thống Trong số 1600 mẫu này, 305 phân loại sai gồm 28 mẫu liệu lớp bị phân loại sai, 114 mẫu liệu lớp bị phân loại sai, 18 mẫu liệu lớp bị phân loại sai, 44 mẫu liệu lớp bị phân loại sai, 27 mẫu liệu lớp bị phân loại sai, 13 mẫu liệu lớp bị phân loại sai, 50 mẫu liệu lớp bị phân loại sai, 11 mẫu liệu lớp bị phân loại sai Do đó, độ xác phân loại cho lớp 86,0%, lớp 43,0%, lớp 91,0%, lớp Ngoài việc thử nghiệm đánh giá kết huấn luyện phân loại mạng VGG16 trường hợp với loại bệnh, loại bệnh, loại bệnh Trong luận văn trình bày kết số cơng trình nghiên cứu khác với mơ hình mạng khác tập liệu bệnh cà chua, thể bảng 4.2 Trong bảng cho ta thấy kết huấn luyện phân loại mơ hình: AlexNet, GoogleNet, Inception V3, ResNet 50 mơ hình VGG16 luận văn Cụ thể, mơ hình AlexNet huấn luyện phân loại loại bệnh cà chua đạt hiệu suất 98,93% Tương tự, mơ hình GoogleNet, Inception V3, ResNet 50 có hiệu suất huấn luyện phân loại đạt 99,39%; 98,65%; 99,15% Đối với mơ hình VGG16 luận văn đạt hiệu suất huấn luyện phân loại đạt: 84,45%, 92,20%, 98,00% cho trường hợp loại bệnh, loại bệnh loại bệnh Qua phân tích cho ta thấy rõ ràng với mơ hình mạng khác tập liệu khác cho hiệu suất khác Trong mơ hình kiến nghị luận văn, trường hợp có tập liệu với số loại bệnh khác cũng có hiệu suất khác nhau, tập liệu với loại bệnh cho hiệu suất cao 98% Bảng 2: Hiệu suất phân loại mơ hình mạng với mơ hình khác [20] mơ hình luận văn KẾT LUẬN Bài báo xây dựng hệ thống phân loại bệnh việc phân loại ảnh sử dụng mạng nơron tích chập - VGG16 Dữ liệu sử dụng báovới 8000 ảnh bệnh khỏe cà chua thu thập từ tập liệu Plantvillage Tất ảnh tập liệu có kích thước [256x256x3] định lại kích cỡ [224x224x3] cho phù hợp với u cầu đầu vào mơ hình VGG16 Mỗi tập bệnh làm tập liệu tập huấn luyện tập kiểm tra với tỷ lệ 80% 20% Trong báo tiến hành huấn luyện phân loại bệnh cà chua với bốn trường hợp loại tập bệnh, loại tập bệnh, loại tập bệnh, loại tập bệnh tách Kết huấn luyện phân loại đạt hiệu suất cao 98% loại tập bệnh, 92% loại tập bệnh, 85,45% loại tập bệnh thấp 80,94% loại tập bệnh tách Thời gian huấn luyện cũng có thay đổi tương ứng nhanh 1075 phút loại tập bệnh, 1832 phút loại tập bệnh, 2804 phút loại tập bệnh lâu 3144 phút loại tập bệnh tách khỏi Qua kết cho thấy mô hình đạt hiệu suất tương đối cao LỜI CẢM ƠN Các tác giả muốn gửi lời cảm ơn đến trường Đại học Sư Phạm Kỹ Thuật Tp HCM tạo điều kiện thuận lợi để hoàn thành nghiên cứu TÀI LIỆU THAM KHẢO [1] Dr.Neha Mangla, Priyanka B Raj, Soumya G Hegde, Pooja R, “Paddy Leaf Disease Detection Using Image Processing and Machine Learning”, International Research in Journal IJIREEICE of Electrical, Innovative Electronics, Instrumentation and Control Engineering, vol 7, Issue 2, 2019 [2] Melike Sardogan, Adem Tuncer, Yunus Ozen, “Plant Leaf Disease Detection and Classification Based on CNN with LVQ Algorithm”, 3rd International Conference on Computer Science and En-gineering, 2018 [3] Serawork Wallelign, Mihai Polceanu, Cedric Buche, “Soybean Plant Disease Indentification Using Convolutional Neural Network”, The Thirty-First International Florida Artificial Intelligence Re-search Society Conference, FLAIRS-31, 2012 [4] Samer Hijazi, Rishi Kumar, Chris Rowen, IP Group, Cadence, Using Convolutional Neural Net-works for Image Recognition, 2018 [5] S.Santhana Hari, Dr.P.Renuga, Mr.Sivakumar, S.Karthikeyan, S.Suriya, “Detection Of Plant Dis-ease By Leaf Image Using Convolutional ViTECoN Vision Neural International Towards Network”, Conference Emerging Trends Communication and Networking, 2019 on in [6] Jiahuan Zhou, Di Xiao, Mengyi Zhang, “Feature Correlation Loss in Convolution Neural Networks for Image Classification”, IEEE 3rd Information Technology, Networking, Electronic and Automation Control Conference, 2019 [7] Adnan Mushtaq Ali Karol, Drushti Gulhane, Tejal Chandiwade, “Plant Disease Detection Using CNN & Remedy”, IJAREEIE International Journal of Advanced Research in Electrical, Electronics and Instrumentation Engineering, vol 8, issue 3, 2019 [8] Aravind Krishnaswamy Rangarajan, Raja Purushothaman, “Disease Classification in Eggplant Using Pre-trained VGG16 and MSVM”, Scientific Reports Nature Research, 2020 [9] Srdjan Sladojevic, Marko Arsenovic, Andras Anderla, Dubravko Culibrk, Darko Stefanovic, “Deep Neural Networks Based Recognition of Plant Disease by Leaf Image Classification”, Hindawi Publishing Corporation Computational Intelligence and Neuroscience Volume 2016, Article ID 3289801, 11 pages, 2016 [10] Sachin B.Jadhav, Vishwanath R.Udupi, Sanjay B.Patil, “Convolutional Neural Networks For Leaf Image-based Plant Disease Classification”, IAES International Journal of Artificial Intelligence, vol 8, No 4, pp 328~341, 2019 [11] Muhammad Hammad Saleem, Johan Potgieter, Khalid Mahmood Arif, “Plant Disease Detection And Classification By Deep Learing”, Plants MDPI, vol 8, pp 468, 2019 [12] Qian Yan, Baohua Yang, Wenyan Wang, Bing Wang, Peng Chen, Jun Zhang, “Apple Leaf Disease Recognition Based on An Improved Convolutional Neural Network”, MDPI Journal Sensors, 2020 [17] Sharada Prasanna Mohanty, David Hughes, Marcel Salathe, “Using Deep Learning For Image-Based Plant Disease Detection”, Digital Epidemiology Lab, EPFL, Switzerland, 2016 [13] Sijiang Huang, Weijie Liu, Fei Qi, Kepeng Yang, “Development And Validation Of A Deep Learning Algorithm For The Recognition Of Plant Disease”, IEEE 21st International Conference on High Performance Computing and Communications; IEEE 17 th International Conference on Smart City; IEEE 5th International Coference on Data Science and Systems, 2019 [14] Krishnaswamy Rangarajan Aravind, Purushothaman Raja, “Automated Disease Classification In Agricultural Crops Using Transfer Learning”, Automatika Journal for Control, Measurement, Electronics, Computing and Communications, vol 61, pp 260-272, 2020 [15] Siddharth Das, “CNN Architectures: LeNet, AlexNet, VGG, GooLeNet, ResNet”, Analytics Vidhya, Analytics and Data Science professionals, 2017 [16] Yosuke Toda, Fumlo Okura, “How Convolution Neural Network Diagnose Plant Disease’, AAAS Plant Phenomics, Volume 2019, Article ID 9237136, 14 pages, 2019 [17] Karen Simonyan, Andrew Zisserman, “Very Deep Convolutional Networks Fos Large-scale Image Recognition”, Computer Vision and Pattern Recognition, arXiv: 1409 1556v6, 2015 [18] Basmah Hyder, Muhammad Adeel Asghar, Fawad Khan, “Classification And Identification Of Tomato Leaf Disease Using Deep Neural Network”, ResearchGate, Conference Paper, IEEE Xplore, 2020 [19] Aravind Krishnaswamy Rangarajan, Raja Purushothanman, Aniirudh Ramesh, “Tomato Crop Disease Classification Using Pre-trained Deep Learning Algorithm”, Internatinal Conference on Robotics and Smart Manufacturing, Procedia Computer Science 133(2018), pp 1040-1047, 2018 [20] Valeria Maeda Gutierrez, Carlos E.Galvan Tejada, Laura A.Zanella Calzada, “Comparision Of Convolutional Neural Network Architectures for Classification ot Tomato Plant Diseases”, MDPI Journal Applied Sciences, 2020 [21] Tijmen Tieleman and Geoffrey Hinton, “Lecture 6.5-RMSProp: Divide The Gradient by A Running Average of Its Recent Magnitude”, COURSERA: Neural Networks for Machine Learning,2012 [22] Kingma, D.P., & Ba, J L, “Adam: A Method for Stochastic Optimization”, International Conference on Learning Representations, 2015 Thơng tin liên hệ tác giả (người chịu trách nhiệm viết): Họ tên: Nguyễn Minh Tuấn Đơn vị: Trường Trung cấp Bách Nghệ Tp.HCM Điện thoại: 0909914482 Email: tuanthien19022015@gmail.com Xác nhận Giảng viên hướng dẫn PGS.TS Nguyễn Thanh Hải ... cho nhận biết bệnh việc phân loại ảnh lá? ?? ii Luận văn Thạc sĩ: ? ?Ứng dụng mạng học sâu cho nhận biết bệnh việc phân loại ảnh lá? ?? iii Luận văn Thạc sĩ: ? ?Ứng dụng mạng học sâu cho nhận biết bệnh việc. .. việc phân loại ảnh lá? ?? iv Luận văn Thạc sĩ: ? ?Ứng dụng mạng học sâu cho nhận biết bệnh việc phân loại ảnh lá? ?? v Luận văn Thạc sĩ: ? ?Ứng dụng mạng học sâu cho nhận biết bệnh việc phân loại ảnh lá? ??... Luận văn Thạc sĩ: ? ?Ứng dụng mạng học sâu cho nhận biết bệnh việc phân loại ảnh lá? ?? vii Luận văn Thạc sĩ: ? ?Ứng dụng mạng học sâu cho nhận biết bệnh việc phân loại ảnh lá? ?? viii Luận văn Thạc sĩ: “Ứng

Ngày đăng: 16/03/2022, 10:59

Tài liệu cùng người dùng

Tài liệu liên quan