Gần đây, do sự phát triển của công nghệ máy tính, đặc biệt là các kỹ thuật trí tuệ nhân tạo, nó đã có thể phát hiện sớm bệnh cây bằng cách sử dụng hình ảnh để phân biệt giữa các bệnh, mộ
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỐ HỒ CHÍ MINH
KHOA KHOA HỌC SINH HỌC
CHẨN ĐOÁN BỆNH THỰC VẬT BẰNG
SINH HỌC PHÂN TỬ
ỨNG DỤNG KỸ THUẬT CNNs TRONG CHẨN ĐOÁN BỆNH LÁ CÀ CHUA (Lycopersicum esculentum)
Ngành học
Chuyên ngành
Nhóm thực hiện
Niên khóa
: CÔNG NGHỆ SINH HỌC : CÔNG NGHỆ SINH HỌC : NHÓM 3 THỨ 5 CA 3 : 2021 – 2025
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỐ HỒ CHÍ MINH
KHOA KHOA HỌC SINH HỌC
CHẨN ĐOÁN BỆNH THỰC VẬT BẰNG
SINH HỌC PHÂN TỬ
ỨNG DỤNG KỸ THUẬT CNNs TRONG CHẨN ĐOÁN BỆNH LÁ CÀ CHUA (Lycopersicum esculentum)
PGS TS NGUYỄN BẢO QUỐC
NGUYỄN LAN ANH NGUYỄN THỊ LAN ANH
ĐỖ NGỌC BẢO CHÂN NGÔ NGỌC HẢI
21126009 21126014 21126287 21126324
TP Thủ Đức, 12/2024
Trang 3MỤC LỤC
Trang
MỤC LỤC i
DANH SÁCH CÁC BẢNG ii
DANH SÁCH CÁC HÌNH iii
Chương 1 MỞ ĐẦU 1
1.1 Đặt vấn đề 1
1.2 Mục tiêu thực hiện 2
1.3 Nội dung thực hiện 2
Chương 2 TỔNG QUAN TÀI LIỆU 3
2.1 Mạng thần kinh chuyển đổi (CNNs – convolutional neural networks) 3
Chương 3 VẬT LIỆU VÀ PHƯƠNG PHÁP 6
Chương 4 KẾT QUẢ VÀ THẢO LUẬN 9
4.1 Kết quả và thảo luận 9
Chương 5 KẾT LUẬN VÀ KIẾN NGHỊ 11
TÀI LIỆU THAM KHẢO 12
Trang 4DANH SÁCH CÁC BẢNG
Bảng 3.1 Siêu tham số cho mô hình 7 Bảng 4.1 Kết quả mô hình 9
Trang 5DANH SÁCH CÁC HÌNH
Hình 3.1 Hình ảnh mẫu của lớp dữ liệu 6
Hình 3.2 Cấu trúc chẩn đoán bệnh lá cà chua 7
Hình 4.1 Độ chính xác của mô hình 9
Bảng 4.2 Tổn thất mô hình 9
Hình 4.3 Ma trận nhầm lẫn trên dữ liệu thử nghiệm 10
Trang 6Chương 1 MỞ ĐẦU
1.1 Đặt vấn đề
Ngành nông nghiệp được coi là ngành sản xuất có năng suất cao nhất trong hầu hết các quốc gia, đóng vai trò quan trọng trong nền kinh tế toàn cầu của đất nước (Altalak et al., 2022), (AlAsadi et al., 2017) Sau ngành dầu mỏ, ngành nông nghiệp Iraq là đóng góp lớn thứ hai vào Tổng sản phẩm quốc nội (GDP) của quốc gia, sử dụng hơn 20% lực lượng lao động của đất nước (Al-Ansari et al., 2021) Một trong những loại cây trồng và sản xuất phổ biến nhất là cây cà chua (Zaki et al., 2020), được trồng rộng rãi trên đồng ruộng và trang trại; cứ mười nông dân thì có chín người trồng
cà chua trên trang trại của họ (Agarwal et al., 2020) Theo tổ chức lương nông (FAO),
cà chua là loại rau quả đứng thứ sáu về số lượng trên thế giới, với sản lượng cà chua trung bình trên toàn thế giới hơn 180 triệu tấn mỗi năm (Khasawne và ctv, 2022), (Bhujel và ctv, 2022) và mức tiêu thụ bình quân đầu người hơn 20 kg mỗi năm (Adeoye và ctv, 2017, chiếm khoảng 15% tổng lượng rau tiêu thụ (Zhao và ctv, 2021)
Cà chua là loại rau phổ biến nhất ở Iraq, với sản lượng khoảng 771.000 tấn trên toàn quốc, với sản lượng cao ở Karbala (Jasim và ctv, 2020), Basrah (Hussein và ctv, 2019)
và Najaf (Al-ani và ctv, 2011) Lý do chính dẫn đến sự suy giảm sản lượng cây trồng
và gia tăng tổn thất là sâu bệnh, hàng tấn cây trồng bị mất mỗi năm (Hasan và ctv, 2020) Do đó, việc phát hiện sớm các bệnh này là rất cấp bách để tránh tổn thất lớn và tăng năng suất Các phương pháp truyền thống để phát hiện bệnh cây cần đến chuyên gia chẩn đoán (Sabri và ctv, 2020), tốn kém về thời gian và công sức, cần các dụng cụ đặc biệt ngoài tỷ lệ lỗi chẩn đoán cao và không thể thực hiện bằng mắt thường (Ashok
và ctv, 2020), (Dhandapani và ctv, 2022)
Gần đây, do sự phát triển của công nghệ máy tính, đặc biệt là các kỹ thuật trí tuệ nhân tạo, nó đã có thể phát hiện sớm bệnh cây bằng cách sử dụng hình ảnh để phân biệt giữa các bệnh, một quy trình tự động cho các cánh đồng và trang trại (Karthik và ctv, 2020), (Elsayed và ctv, 2019) Bài báo nghiên cứu này trình bày một mô hình mới
có thể phát hiện và phân loại các bệnh phổ biến nhất trên lá cà chua mà không cần chuyên gia chẩn đoán, qua đó giúp nông dân cải thiện sản xuất và tăng lợi nhuận Mô hình được trình bày này dựa trên mạng thần kinh tích chập (CNN), một mạng học sâu
Trang 7hiệu suất cao thường được sử dụng trong nhận dạng bệnh cây trồng (Singh và ctv, 2021), (Al-Akkam và ctv, 2022)
Bệnh hại lá cà chua là một thách thức đáng kể trong nông nghiệp, gây ra những tổn thất kinh tế nghiêm trọng Việc phát triển các phương pháp chẩn đoán bệnh chính xác và sớm là một nhu cầu cấp thiết Các kỹ thuật nâng cao, đặc biệt là mạng thần kinh chuyển đổi (CNNs – convolutional neural networks), cho thấy triển vọng trong việc nhận biết các dấu hiệu bệnh trong thời gian sớm và giúp tránh được những tốn kém trong tương lai Nghiên cứu này trình bày một mô hình dựa trên CNNs để xác định các bệnh lá cà chua ở giai đoạn sớm nhằm bảo toàn sản lượng và tăng năng suất Một tập
dữ liệu từ cơ sở dữ liệu plantvillage đã được sử dụng với 11.000 bức ảnh từ 10 loại bệnh riêng biệt để đào tạo mô hình của mình CNNs của chúng tôi đã được đào tạo trên tập dữ liệu này và mô hình được đề xuất đạt được tỷ lệ chính xác đáng kinh ngạc
là 96% Khả năng nhận diện bệnh sớm của mô hình CNNs có tiềm năng ứng dụng rộng rãi trong thực tế, hỗ trợ nông dân đưa ra các biện pháp phòng trừ kịp thời, giảm thiểu thiệt hại về năng suất và chất lượng sản phẩm, đồng thời góp phần nâng cao hiệu quả sản xuất nông nghiệp
1.2 Mục tiêu thực hiện
Xây dựng một mô hình CNN có khả năng phân loại chính xác các loại bệnh lá
cà chua dựa trên hình ảnh, và đánh giá hiệu năng của mô hình trên một tập dữ liệu lớn
và đa dạng
1.3 Nội dung thực hiện
Nội dung 1: Thu thập dữ liệu bệnh lá cà chua
Nội dung 2: Đánh giá mô hình
Trang 8Chương 2 TỔNG QUAN TÀI LIỆU
2.1 Mạng thần kinh chuyển đổi (CNNs – convolutional neural networks)
Dựa trên học máy và xử lý ảnh, nhiều nhà nghiên cứu đang cố gắng đưa ra các giải pháp khác nhau cho vấn đề phát hiện bệnh lá cà chua để tạo ra một phân loại tự động chính xác Gần đây, các nhà nghiên cứu đã bắt đầu sử dụng các kỹ thuật học sâu
để tạo ra kết quả chính xác hơn Một số phương pháp dựa trên học sâu phù hợp nhất để phát hiện bệnh lá cà chua được trình bày trong phần này:
Tm và ctv (Tm và ctv, 2018) đã đề xuất một mô hình LeNet dựa trên CNN để phát hiện và xác định mười bệnh trên cây trồng cà chua vào năm 2018 Với ít tài nguyên tính toán nhất và công nghệ dễ nhất (LeNet), công việc được đề xuất giải quyết vấn đề nhận dạng bệnh lá cà chua Các bức ảnh trong bộ dữ liệu PlantVillage được thu nhỏ xuống độ phân giải 60x60 để đẩy nhanh quá trình đào tạo và giúp việc đào tạo mô hình khả thi về mặt tính toán Độ chính xác của hệ thống được đề xuất dao động từ 94% đến 95% trung bình
Kumar và ctv (Kumar và ctv, 2019) đã phân tích mạng lưới nhóm hình học thị giác (VGG) Net, LeNet, ResNet50 và Xception từ đầu để phân loại chín bệnh lá cà chua khác nhau bằng cách sử dụng một cặp bộ dữ liệu PlantVillage, bộ dữ liệu ImageNet vào năm 2019 Các phát hiện cho thấy, trong tất cả các kiến trúc được nghiên cứu, VGGNet được tinh chỉnh đạt được độ chính xác cao nhất và tổn thất thấp nhất, với độ chính xác kiểm tra là 99,25% Hạn chế chính của phương pháp được đề xuất là thời gian đào tạo rất lâu và yêu cầu thiết bị phần cứng đắt tiền
Ashok và ctv (2020) đã giới thiệu một mô hình mới dựa trên CNN để phát hiện bệnh lá cây cà chua đã được phát triển bằng cách sử dụng các thuật toán nguồn mở, phân đoạn và kỹ thuật xử lý ảnh dựa trên phân cụm để cải thiện hình ảnh Bộ lọc Gaussian được sử dụng trong quá trình tiền xử lý để loại bỏ mờ và giảm nhiễu Tính năng được trích xuất bằng cách sử dụng biến đổi sóng rời rạc (DWT) và ma trận đồng hiện mức xám (GLCM) Mức độ chính xác 98% đã đạt được bằng cách sử dụng chiến lược được đề xuất
Nghiên cứu của Zhao và ctv (2021) đã phát triển một mạng thần kinh tích chập sâu với nhiều miền trích xuất đặc trưng để chẩn đoán bệnh lá cà chua Mô hình được
Trang 9đào tạo để phân biệt giữa hình ảnh lá cà chua khỏe mạnh và bị bệnh bằng cách tích hợp mật độ chú ý và độ sâu khối lượng dư Kết quả thí nghiệm cho thấy mô hình được
đề xuất đạt được độ chính xác nhận dạng trung bình là 96,81% trên bộ dữ liệu bệnh lá
cà chua, vượt trội hơn so với các thí nghiệm học sâu trước đó sử dụng bộ dữ liệu PlantVillage phổ biến nhất
Benoso và ctv (2020) đã chứng minh việc phát triển các ứng dụng và hệ thống tính toán để phát hiện bệnh trên cây cà chua vào năm 2020 Các tác giả đã sử dụng các
bộ mô tả thống kê về kết cấu và màu sắc để trích xuất các đặc điểm và các bộ phân loại khác nhau để xác định bệnh Ba bệnh có thể được phát hiện bằng các phương pháp được đề xuất trong bài báo này (virus khảm, bệnh muội và đốm lá septoria) trên lá cà chua Bộ dữ liệu hình ảnh làng thực vật có 160 hình ảnh cho mỗi bệnh, được phân loại bởi K-nearest neighbors (K-NN), rừng ngẫu nhiên, máy hỗ trợ vectơ (SVM), mạng thần kinh nhân tạo (ANN) và naive bayes Rừng ngẫu nhiên có độ chính xác cao nhất
là 90,7%
Theo Agarwal và ctv (2020) đã tạo ra một mô hình CNN với ba lớp max-pooling, ba lớp tích chập và hai lớp kết nối đầy đủ Hiệu quả của mô hình được đánh giá bằng các tiêu chí khác nhau, bao gồm đào tạo, xác thực, độ chính xác kiểm tra và
số lượng tham số có thể đào tạo Bộ dữ liệu làng thực vật có chín lớp bệnh và các lớp
có hình ảnh khỏe mạnh Mô hình được đề xuất có độ chính xác trung bình là 91,2% Ngoài ra, Bốn kiến trúc CNN, bao gồm VGG-19, ResNet, VGG-16 và Inception V3,
đã được Ahmad và ctv (2020) đề xuất vào năm 2020 để nhận dạng và phân loại bệnh
lá cà chua Hai bộ dữ liệu được sử dụng trong nghiên cứu này là dữ liệu thực địa tự thu thập và bộ dữ liệu dựa trên phòng thí nghiệm có tên là Plant village Trên bộ dữ liệu dựa trên thực địa, các mô hình này không hoạt động tốt trong bộ dữ liệu dựa trên phòng thí nghiệm chỉ sử dụng bốn lớp bệnh lá cà chua (2.364 hình ảnh) Trên cả hai bộ
dữ liệu, Inception V3 được tìm thấy có hiệu suất tốt nhất Độ chính xác cao nhất là 93,40% đã đạt được trong bộ dữ liệu dựa trên phòng thí nghiệm
Dựa trên mô hình CNN EfficientNet được tạo ra gần đây, Chowdhury và ctv (2021) đã xây dựng một mô hình mạng thần kinh tích chập sâu để phân đoạn hình ảnh
lá khỏi nền Các tác giả đã sử dụng hai mô hình phân đoạn, U-net và U-net sửa đổi Ngoài ra, một lớp khác của lá khỏe mạnh và bị bệnh đã được sử dụng để phân loại
Trang 10Các phát hiện cho thấy mô hình hoạt động tốt hơn một số kỹ thuật học sâu đương đại, với độ chính xác là 99,89%
Hai mạng thần kinh tích chập (CNNs), GoogLeNet và VGG16, đã được Kibriya
và ctv (2021) sử dụng để phân loại bệnh lá cà chua Bằng cách sử dụng chiến lược học sâu, công việc được đề xuất tìm cách xác định câu trả lời lý tưởng cho vấn đề phát hiện bệnh lá cà chua Trên bộ dữ liệu làng thực vật gồm 10.735 hình ảnh lá, VGG16 đạt độ chính xác 98,8% và GoogLeNet đạt điểm số 99,23% Trong nghiên cứu này, lá của cây
cà chua chỉ chứa ba bệnh nhiễm trùng, được xác định và phân loại
Trang 11Chương 3 VẬT LIỆU VÀ PHƯƠNG PHÁP
3.1 Thu thập dữ liệu
Các hình ảnh về bệnh lá cà chua được thu thập từ cơ sở dữ liệu plantvillage được công bố trên Kaggle, trong đó có 11.000 hình ảnh của mười loại bệnh lá khác nhau, chín loại bệnh lá khác nhau và một loại lá bình thường Cơ sở dữ liệu được chia thành 10.000 hình ảnh huấn luyện cho mỗi lớp, mỗi lớp 1.000 hình ảnh và 1.000 hình ảnh để kiểm tra, mỗi lớp 100 hình ảnh Kích thước của tất cả các hình ảnh là 256×256
và định dạng là jpg Các lớp này là bệnh lá cà chua phổ biến nhất: vi-rút khảm, đốm mục tiêu, bệnh mốc sương muộn, đốm lá septoria, vi-rút xoăn lá vàng, nấm mốc lá, nhện đỏ hai đốm, bệnh mốc sương sớm và đốm vi khuẩn Bộ dữ liệu chứa các hình ảnh không nhiễu, do đó không cần loại bỏ nhiễu như một bước tiền xử lý Các hình ảnh đã được giảm kích thước xuống độ phân giải 128×128 pixel để đẩy nhanh quá trình huấn luyện
Hình 3.1 Hình ảnh mẫu của lớp dữ liệu.
3.2 Xây dựng mô hình dữa vào thuật toán Deep learning
Mô hình convolutional neural networks (CNN) được sử dụng và chạy trên Colab, một môi trường phần mềm tích hợp sẵn CNN gồm 2 phần là feature extraction
và phân loại Phần feature extraction gồn 3 lớp convolution có 64, 32, 16 bộ lọc và sau mỗi lớp sẽ có kèm theo 1 lớp max-pooling Nhiệm vụ mỗi lớp convolution là học các đặc trưng từ dữ liệu đầu vào và max-pooling giúp giảm số lượng tham số và loại bỏ
Trang 12nhiễu Phần phân loại chứa 500 no-ron Mô hình được tối ưu hoá bằng điều chỉnh các siêu tham số để tránh dữ liệu quá khớp hay bị lệch
Hình 3.2 Cấu trúc chẩn đoán bệnh lá cà chua.
Quá trình tối ưu hóa được thực hiện bằng trình tối ưu hóa Adam và hàm mất mát là entropy chéo phân loại có (5) được hiển thị như sau:
E (W ,b)=−∑
i=1
m
y i log ( pi)
Trong đó:
P: xác suất mong đợi, y: xác suất mục tiêu, m: số lớp
Một dropout (0,5) đã được sử dụng để tránh quá khớp và các kỹ thuật tăng cường dữ liệu như phóng to hình ảnh, cắt theo chiều dọc, lật ngang và thay đổi tỷ lệ
Mô hình đã được đào tạo trong 40 giai đoạn với 64 kích thước lô Các siêu tham số
cho mô hình được mô tả trong Bảng 3.1.
Bảng 3.1 Siêu tham số cho mô hình
Chức năng kích hoạt ReLU
Trang 133.3 Đánh giá mô hình
Mô hình được đánh giá qua độ chính xác (accuracy), vì độ chính xác giúp phân loại để đưa ra chẩn đoán chính xác Ngoài ra, Precision (Pre), F_score và Recall (Rec) cũng được sử dụng để đo hiệu suất mô hình Đây là phương pháp phổ biến và hiệu quả trong việc xây dựng mô hình
Các biện pháp này được giải thích bằng các công thức sau:
A C= P1+N1
P1+N1+F+F2
Pre= P1
P1+F
F core =2× Pre × Rec
Pre +Rec
Rec= P1
P1+N2
Trong đó:
P1: số kết quả dương tính thật (kết quả là dương tính và dự kiến là dương tính)
N2: số lượng kết quả âm tính giả (mặc dù có dự đoán ngược lại nhưng vẫn có kết quả dương tính)
F : số lượng kết quả dương tính giả (kết quả là âm tính và được dự đoán
là âm tính.)
N1: số lượng kết quả âm tính thực sự (mặc dù được dự đoán là dương tính nhưng kết quả lại là âm tính)
Trang 14Chương 4 KẾT QUẢ VÀ THẢO LUẬN
4.1 Kết quả và thảo luận
Kết quả thu được chứng minh khả năng của mô hình được trình bày, dựa trên CNN, hiệu quả của nó trong việc phát hiện và phân loại bệnh lá cà chua Bằng cách đào tạo mô hình trên tập dữ liệu PlantVillage, giá trị độ chính xác cao nhất trong 40 kỷ nguyên đã thu được, với giá trị trung bình là 96% và biên độ mất mát là 0,1 Độ chính xác thử nghiệm là 92% Giá trị của độ chính xác thu được là 91%, giá trị của độ thu
hồi là 92% và giá trị của điểm F là 92 Bảng 4.1 cho thấy các kết quả quan trọng nhất
thu được
Bảng 4.1 Kết quả mô hình
Mô hình Bộ dữ liệu Độ chính xác
(accuracy)
Hao hụt
Độ chính xác (precision)
Thu hồi Điểm F 1
CNNs PlantVillage 96% 0.1 91% 92% 92%
Mô hình đề xuất khác biệt với các mô hình truyền thống, chẳng hạn như VGG16 và ResNet, ở tốc độ và không yêu cầu không gian lưu trữ rộng rãi so với các
mô hình CNN truyền thống Xếp hạng độ chính xác cho quá trình đào tạo và thử
nghiệm kết hợp với số kỷ nguyên được trình bày trong Hình 4.1 Các giá trị mất mát cho quá trình đào tạo và thử nghiệm được hiển thị trong Hình 4.2.
Hình 4.1 Độ chính xác của mô hình Hình 4.2 Tổn thất mô hình.
Mô hình được đề xuất so sánh với các mô hình CNN trước đây sử dụng các cấu trúc thông thường, chẳng hạn như Lenet, Resent và Alexnet, tất cả đều sử dụng cùng một cơ sở dữ liệu Kết quả cho thấy mô hình của chúng tôi vượt trội về độ chính xác khi đào tạo và kiểm tra Mô hình của chúng tôi sử dụng ít lớp hơn (chỉ 4 lớp) so với các cấu trúc CNN truyền thống, có thể lên tới hàng trăm lớp Do đó, mô hình được đề