Bài báo “Deep neural network features fusion and selection based on PLS regression with an application for crops diseases classification” [9] các tác giả nghiên cứu dé xuất kiến trúc có
Trang 1ĐẠI HỌC QUOC GIA TP HO CHÍ MINH
TRUONG DAI HOC CONG NGHE THONG TIN
KHOA MANG MAY TINH VA TRUYEN THONG
NGUYEN VAN HIEU- 19521510
LE BUI QUANG HOP- 19521553
KHOA LUAN TOT NGHIEP
XAY DUNG CO CHE PHAT HIEN BENH TREN LA
CAY DUA TREN KIEN TRUC TRANSFORMER
TREN THIET BI HAN CHE PHAN CUNG
BUILDING A DISEASE DETECTION MECHANISM BASED ON TRANSFORMER ARCHITECTURE ON
RESOURCE CONSTRAINED DEVICES
KỸ SU NGÀNH MẠNG MAY TÍNH VA TRUYEN THONG DU’
LIEU
GIANG VIEN HUONG DAN
ThS THAI HUY TAN va ThS TRAN THI DUNG
TP HO CHÍ MINH, 2023
Trang 2LỜI CẢM ƠN
Lời đầu tiên, chúng em xin gửi lời cảm ơn chân thành nhất đến ban giám hiệu,quý thầy cô và các nhân viên của trường Đại học Công Nghệ Thông Tin và xin đặcbiệt cảm ơn các thầy cô trong khoa Mạng máy tính và Truyền thông đã tận tình hướngdẫn, giảng dạy cho chúng em những kiến thức bồ ích trong suốt những năm học qua.Những kiến thức này đã giúp chúng em hiểu rõ hơn về lĩnh vực mà chúng em đang
theo đuôi và trang bị cho chúng em nền tảng vững chắc dé tiếp tục phát triển trong
tương lai.
Chúng em xin gửi lời cảm ơn chân thành nhất đến ThS Thái Huy Tân và ThS.Tran Thị Dung, chúng em rat biết on thầy cô đã dành thời gian và công sức dé theodõi và đánh giá bài làm của chúng em, cung cấp cho chúng em những ý kiến xâydựng và giúp chúng em hiéu rõ hơn về đề tài Những lời khuyên và chi dan của thay
cô đã giúp chúng em vượt qua những khó khăn và hoàn thành khóa luận một cách
thành công.
Cuối cùng, chúng em xin gửi lời cảm ơn và sự tri ơn sâu sắc nhất đến gia đình
đã tạo mọi điều kiện có thê về vật chất lẫn tinh than, luôn luôn khích lệ, động viên,
hỗ trợ và là điểm tựa vững chắc nhất cho chúng em trong suốt thời gian học tập vừa
qua.
Khóa luận là thành quả của sự nỗ lực, công sức và tâm huyết của chúng em
trong thời gian qua, việc thiếu sót trong trình bày kiến thức là điều không thể nàotránh khỏi, chúng em kính mong các quý thầy cô xem xét và chỉ bảo giúp chúng em
Chúng em một lần nữa xin chân thành cảm ơn!
TP.HCM, ngày tháng năm 2023
Sinh viên 1 Sinh viên 2
(Ký tên và ghi rõ họ tên) (Ký tên và ghi rõ họ tên)
Trang 3MỤC LỤC
Chương I MO ĐẦU -52- S5 E22EEEEEEEE221121127121211211 1111.211 3
1.1 Lý do chọn đề tài ¿22-5522 E2 E2EEE21211211211111111211 1111211 E1x xe 3
1.2 Mục tiêu để tài -cccc tt nhieu 61.3 Đối tượng và mục tiêu nghiên cứu -¿- ¿+z+++2x++zx++zxvzxeerxesres 6
1.4 Phương pháp nghiÊn CỨU - Ă 2c 3911131113 11 11 111 vn rệt 6
1.5 Cấu trúc khoá luận : c++t2c+vtttEEktrttEkirtttrtrtrtrirrrrrirrrrrireied 8
Chương2 CO SỞ LÝ THUYÊT 2 22- 22SE+SE+2EE2EESEESEEEEEEEEerkrrkerex 10
2.1 Các công trình nghiên cứu liên quan 5+ + £++k+sexeesxeersserssss 10
2.1.1 Cac công trình nghiên cứu theo hướng các mô hình học máy cơ bản 10
2.1.2 Các công trình nghiên cứu theo hướng các mô hình học máy ANN 14
2.1.3 Các công trình nghiên cứu theo hướng các mô hình CNN và một số mô
BQ 20" 31
Trang 44.2 Môi trường thử nghiệm và độ đo đánh giá -. 5c 55c + s+ssssssersss 37
4.3 Kết quả thử nghiệm 2 2+S2+SE+EE2EE2EEE71E21121121171 712112111, 39
4.3.1 Kết quả huấn luyện và đánh giá độ chính xác mô hình 39
4.3.2 Kết quả kiểm thử tốc độ và khả năng hoạt động trên thiết bị hạn chế phần
cúng 43
4.4 Hiện thực ứng dụng di động - - - c3 2+ 321v sirrirreerrerkrree 45
4.4.1 Giao diện màn hình SplashScreen - s6 55 + ‡+sksesserssersres 45 4.4.2 Giao diện màn hình chao mừng s5 + x*svEseeeeeeeeeeeesesse 47
4.4.3 Giao diện màn hình đăng nhập - - 5c 55+ *+*‡+sexse+sexseexssss 48
4.4.4 Giao diện màn hình đăng kí - - 5 5< + ‡++*EExeeerseeeeeeereeeere 50
4.4.5 Giao diện màn hình chính - - 2-5222 + + 3+ 22*#*£+22EE++zeeeeezzeeeezzxe 52
4.4.6 Giao diện tìm kiếm cây trồng hoặc các loại bệnh xuất hiện trên cây 534.4.7 Giao diện lựa chọn model dé quét bệnh trên cây - - -+ 544.4.8 Giao diện màn hình trang cá nhân +55 +3 *+*vx+e+eexssrssss 55
4.4.9 Giao diện màn hình nhận dạng bệnh trên cây - 5555-5552 57
4.4.10 _ Giao diện vườn cây CUA tÔI c3 32311 rirsrrrirerrrrrrrsee 59
4.4.11 Giao diện thêm vườn cây THỐI 5 3+ 3+ E+ssEEseeeeeeeereere 60
4.4.12 Giao diện hiển thị tat cả cây có trong VƯỜN - «se 614.4.13 Giao diện thêm cây IỚI - 5-5225 S21 E*EEseEEeerrerererrrerree 62
Trang 5Chương 5 TONG KẾT ¿©22-©2+22S+2ExtSEerErerkesrkrrrrees 65
5.1 KẾt luận 2Lc.St t1 2 S121 111111 1111111111111 5121111111111 Etrke 65
Sữa ti:.- -iiểễếi:ỌỌỤ34 665.1.2 Nhược điểm St St+tSESvSEEEEESESEEEEEEEEEEEEEEEEEEEEE111 1111k 665.2 Hướng phat triỂn :- k+Sk+SE+EE2E2E2EEEEEE11211712112112171 11111 66
Trang 6DANH MỤC HÌNH
Hình 2.1 Ứng dung của NodeJS - 2-52 S£+E2EE2EEEEEEEEEEEEEEEEEEEEErEkrrkerkrrex 25
Hình 2.2 Cách MongoDB hoạt động - - c1 HH re, 26
Hình 2.3 Các tinh năng và ứng dụng của Pytorch «+ ss+ssexsseessers 27
Hình 3.1 Mô hình hệ thống phát hiện bệnh trên thiết bị di động - 30Hình 3.2 Sơ đồ kiến trúc của Le VTT -.-¿-c++2cxvtttrxttttrrrrrrtrrrrrtrrrrrrrrrrre 31
Hình 3.3 Sơ đồ kiến trúc của Simple ViT - 2-52 t+2Et2E2EEeEEeEEerEkrrkerkerkerex 32
Hình 3.4 Sơ đồ kiến trúc của Deep ViT ¿2-2 t+Sx+EE+EE2EE2E2EEEerEerkerkerkrree 33Hình 3.5 Sơ đồ kiến trúc của CrossViT ccsscsssessessesssessessessessessecsessssssessessesssseseeseess 34
Hình 3.6 Sơ đồ kiến trúc của Mobile ViT c2sccccttrktrrrrrrirrrrrrrirrrrrii 35
Hình 4.1 Ảnh minh họa 4 loại bệnh trong tập dữ liệu thử nghiệm 37Hình 4.2 Hình ảnh thê hiện độ chính xác khi tiễn hành training trên tập dir liệu bệnh
CAY DEG NA" /ố£ <.- " 39
Hình 4.3 Hình ảnh thê hiện độ chính xác khi tiến hành validation trên tập dữ liệu
Donh CAY NGG ooo ốc 40
Hình 4.4 Hình ảnh thé hiện độ mat mát khi tiến hành training trên tap đữ liệu bệnh
CAY DEG 0.0 h6 ^*» ốẺố c(Ý sso 40
Hình 4.5 Hình ảnh thê hiện độ mat mát khi tiến hành validation trên tập dữ liệu bệnh
20001777 a 41
Hình 4.6 Giao diện man hình SplashScreen c.ccccessceseesseesseeseeseeeseeeseeeeeeseesseens 46
Hình 4.7 Giao diện màn hình chào mừng - s5 + 33+ ‡++k+veeEseeeeeeerseeers 48 Hình 4.8 Giao diện man hình đăng nhập S5 + ssrssrsee 49 Hình 4.9 Giao diện man hình đăng KkÍ - 5 2S 3213 EEESEreserrresrrerkrree 51
Hình 4.10 Giao diện màn hình chinh cccccecccccsccccesceccesscccesscsccesseecesssseeesseeess 53Hình 4.11 Giao diện màn hình tim kiếm cây trồng và các loại bệnh 54Hình 4.12 Giao điện lựa chọn mô hình đề sử dụng quét bệnh trên cây 55
Hình 4.13 Giao diện màn hình trang cá nhân - - + +++++++sex+seeeseess 56
Hình 4.14 Giao diện màn hình nhận dạng bệnh trên cây và hiển thi thông tin 58
Hình 4.15 Giao diện màn hình vườn cây của tO eee eeeeeeseceseeeeeeeeeeseeeseeereeaeees 59
Trang 7Hình 4.16 Giao diện màn hình thêm vườn cây HỚI - 5 55 55+ £++£+seesex
Hình 4.17 Giao diện màn hình hién thị tat cả các cây có trong vườn
Hình 4.18 Giao diện màn hình thêm cây mới và tinh trạng của cây
Trang 8DANH MỤC BANG
Bang 3.1 Bang mô tả thông số của các mô hình học sâu . 5-2 52 s2 30Bảng 4.1 Bảng thể hiện số lượng hình ảnh trong bộ dt liệu đào tạo và xác thực 36Bang 4.2 Bảng thé hiện thuộc tính của thiết bị trong môi trường thí nghiệm 38Bảng 4.3 Bảng thể hiện thông tin của các thiết bị di động được sử dụng trong môi
trường thí nghñiỆm - + + 1k1 1 1v vn nh gu TH Hà HH Hư ng chà 39
Bảng 4.4 Bảng hiển thị so sánh hiệu suất của các mô hình trong tác vụ phân loại
Bang 4.5 Bảng hiển thị kết quả fps (khung hình trên giây) của từng mô hình trên từng
015100 43Bang 4.6 Bảng hiển thị kết quả sử dụng CPU của từng mô hình trên từng thiết bi.44Bảng 4.7 Bảng hiên thị kết quả sử dung RAM của từng mô hình trên từng thiết bi(don
Bảng 4.8 Bảng hiển thị nhiệt độ của từng mô hình trên từng thiết bi(don vị °c) 45
Trang 9DANH MỤC TU VIET TAT
STT Tir Từ viết tat của
1 ANN Artificial Neural Network
2 API Application Program
Interface
3 AI Artificial Intelligence
4 ViT Vision Transformer
5 DNN Deep neural Network
Trang 10TOM TAT KHOA LUẬN
Nông nghiệp là một ngành kinh tế rất quan trọng trong việc xây dựng nền kinh
tế và đáp ứng nhu cầu cung cấp thực phâm cho con người Tuy nhiên, bệnh thực vật
là một thách thức lớn đối với nông nghiệp, gây thiệt hại cho cây trồng, giảm sản lượng
va ảnh hưởng tiêu cực đến chất lượng sản phẩm Dé giải quyết van dé này, các công
nghệ thông minh như trí tuệ nhân tao (AI), học máy va Internet of Things (IoT) đã
được áp dụng dé phát hiện bệnh thực vật một cách hiệu qua Một phương pháp được
xem là tiềm năng và hiện đại nhất là sử dụng các mô hình học sâu như ViT là một mô hình học sâu dựa trên kiến trúc Vision Transformer (VIT), đã cáchmạng hóa lĩnh vực trí tuệ nhân tạo và đã cho thấy hiệu suất đáng kê trong các tác vụ
Lightweight-nhận dạng hình ảnh.
Trong khoá luận này nhóm của chúng tôi sẽ trình bay một cơ chế mới dé pháthiện sớm bệnh trên cây trồng sử dụng kiến trúc Transformer Bằng cách triển khai
mô hình trên các thiết bi di động có tài nguyên hạn chế, hệ thống có thé phát hiện lá
cây bị bệnh, ngăn chặn sự lây lan của bệnh và hỗ trợ quản lý sức khỏe cây hiệu quả.
Phương pháp này bao gồm xây dựng một tập dữ liệu toàn diện, sử dụng lưu trữ đám
mây và cơ sở dit liệu, sử dụng Google Colab dé huấn luyện và đánh giá các mô hình
Vision Transformer, và triển khai các mô hình trên các thiết bị di động để phát hiện
bệnh thời gian thực Hệ thống cung cấp thông tin kịp thời và chính xác về bệnh trên
cây trồng, tiết kiệm chi phí đáng ké và cải thiện sức khỏe và năng suất tong thé củacây trồng Phương pháp này đại diện cho một công cụ mạnh mẽ cho quản lý bệnhtrên cây trồng trong nông nghiệp và có tiềm năng hỗ trợ các phương pháp nông nghiệp
bền vững và hiệu quả hơn Nghiên cứu đã tập trung vào việc sử dụng các kiến trúc
mang học sâu phô biến hiện nay như LeViT, SimpleViT, MobileViT, CrossViT và
DeepViT Sau đó tiễn hành các thử nghiệm đầy đủ và chỉ tiết trên các tập dữ liệu thực
tế để đánh giá hiệu suất của các mô hình này trên nhiều loại cây trồng khác nhau Kếtquả nghiên cứu cho thấy, các mô hình này đều cho kết quả rất tốt và có khả năng phát
hiện bệnh chính xác trên các loại cây trông khác nhau.
Trang 11Sau khi hoàn thành, khoá luận sẽ đề xuất và triển khai các mô hình học sâu déchân đoán bệnh cây trồng chính xác và hiệu quả nhất trên một ứng dụng di động Nhờ
đó, những người nông dân có thé dé dàng và nhanh chóng phát hiện các bệnh trên
cây trồng của minh và thực hiện các biện pháp kip thời dé ngăn chặn sự hư hai chocây trồng của họ Bằng cách sử dụng giải pháp của chúng tôi sẽ giúp nâng cao năngsuất và chất lượng sản phẩm, giảm thiêu thiệt hại do dịch bệnh gây ra, đồng thời dambảo an ninh thực phẩm cho cộng đồng
Trang 12Chương 1 MỞ ĐẦU
1.1 Lý do chọn đề tài
Nông nghiệp là ngành đóng vai trò quan trọng trong việc xây dựng nền kinh
tế va đáp ứng nhu cầu cung cấp lương thực, thực phẩm cho con người Trong khoảngthời gian từ năm 2000 đến năm 2020, tổng giá trị của ngành nông nghiệp, lâm nghiệp
và đánh bắt cá trên toàn thế giới đã tăng 78% sau khi điều chỉnh theo lạm phát, đạttong cộng 3,6 nghìn tỷ đô la vào năm 2020 Đóng góp lớn nhất cho sự gia tăng này
là Chau A, chiếm ty trọng 64% tổng giá trị gia tăng của thế giới trong các ngành nàyvào năm 2020 Trong khi giá trị gia tăng của nông nghiệp tăng trên toàn cầu vào năm
2020, ngoại trừ ở châu Au, do đại dịch COVID-19, diện tích đất được trang bị chotưới tiêu trên toàn thế giới cũng tăng 20% trong khoảng thời gian này, đạt 349 triệu
ha Phan lớn sự gia tăng này xảy ra ở châu A, chiếm 70% điện tích đất toàn cầu đượctrang bi cho tưới tiêu vào năm 2020 [1] Tuy nhiên, nông nghiệp đang phải đối mặt
với nhiều thách thức, và một trong những thách thức lớn nhất là dịch bệnh trên cây
trong Các loại bệnh trên thực vật có thé gây thiệt hại dang kế cho cây trồng, làm
giảm năng suất và tác động tiêu cực đến chất lượng sản phẩm Trên cây lúa, có thểquan sát thấy một số triệu chứng của bệnh như lá héo, vàng Ua va sọc vàng, cũng như
các vết bệnh trên thân va be lá do bệnh khô van gây ra Mặt khác, bệnh đạo ôn có thể
gây ra bệnh ung trên lá và thân, cuối cùng chuyền sang màu nâu và chết, trong khi
bệnh cháy lá do vi khuẩn có thé dẫn đến cháy ngọn lá và lá bị vàng Tương tự nhưvậy ở cây ngô, các triệu chứng phổ biến của bệnh bao gồm sự hình thành của nốt mụn
trên cây do bệnh than đen gây ra và mụn mủ màu cam đến nâu trên lá do bệnh đóm
lá xám Bệnh cháy lá có thé dẫn đến các vét bệnh hình diéu xì gà trên lá, trong khi
bệnh dom den ở cây ngô có thé gây ra các vết bệnh hình kim cương kéo dài Việc xác
định và hiểu các triệu chứng bệnh trên lúa và ngô có thé khó phát hiện bằng mắtthường Tuy nhiên, điều quan trọng nhất là phải quản lý và phòng ngừa hiệu quả các
bệnh thực vật có thê ảnh hưởng đáng kể đến năng suất cây trồng và sản xuất lương
Trang 13thực toàn cầu Vì vậy, dé giải quyết van dé này, ngành nông nghiệp đã ứng dụng cáccông nghệ thông minh đề theo dõi cây trồng và phát hiện bệnh cây hiệu quả Nhữngcông nghệ này bao gồm hệ thống cảm biến, trí tuệ nhân tạo, học máy và Internet of
Things.
Trí tuệ nhân tạo (AI) đang ngày càng được áp dung nhiều hơn vào nông
nghiệp, nó cung cấp cho nông dân và người trồng trọt những công cu mới dé tối ưuhóa việc quản lý cây trồng và tăng năng suất Học máy là một nhánh của trí tuệ nhântạo có liên quan đến việc tạo ra các thuật toán và mô hình cho phép máy tính học hỏi
và cải thiện từ những kinh nghiệm đã trải qua mà không cần phải lập trình rõ ràng.
Có nhiều loại học máy khác nhau như học có giám sát, học không giám sát và họctăng cường, mỗi loại đều có các phương pháp và ứng dụng riêng Mạng thần kinhnhân tạo (ANN) là một mô hình học máy được lấy cảm hứng từ các cấu trúc và chứcnăng của bộ não thần kinh con người Các nghiên cứu như trong bài "Deep Learning
Approach for Identification of In-Field Diseased Images of Maize Crop [2]" va bài
"Computer-vision classification of corn seed varieties using deep convolutional
neural network [3]" đã làm nồi bat việc sử dụng các mô hình này dé xác định chínhxác các bệnh thực vật, đặc biệt là ở cây ngô Mạng ANN có một số lợi thế bao gồmkhả năng mô hình hóa các mối quan hệ phi tuyến tính phức tạp giữa đầu vào và đầu
ra, khả năng thích ứng với những thay đổi của dit liệu theo thời gian và khả năng chịu
lỗi dé xử ly dé liệu nhiễu va không đầy đủ Chúng cũng có khả năng khái quát hóatốt dit liệu mới điều đó khiến chúng rat phù hợp cho các nhiệm vụ dự đoán và phân
loại Tuy nhiên, ANN cũng có một số hạn chế, điều này có thể gây khó khăn cho việchiểu các quyết định được đưa ra như thế nào Ngoài ra, việc đảo tạo ANN có thể tốnkém về mặt tính toán và chúng có thể yêu cầu một phần cứng cao cũng như yêu cầumột lượng lớn dữ liệu chất lượng cao đề hoạt động tốt những điều này gây khó khăn
và tốn kém để có được
Học sâu là một tập hợp con của học máy sử dụng mạng thần kinh nhân tạo với
nhiều lớp dé phân tích và trích xuất các đặc trưng phức tạp từ dữ liệu Cách tiếp cận
này đã cách mạng hóa lĩnh vực trí tuệ nhân tạo và máy móc sẽ có quyên thực hiện
Trang 14các nhiệm vụ mà trước đây vốn chỉ phù hợp với trí thông minh của con người chắng
hạn như là nhận dạng hình ảnh và giọng nói cũng như xử lý ngôn ngữ tự nhiên.
Vào năm 2020, các nhà nghiên cứu của Google đã phát triển một mô hình học
sâu tiên tiến có tên là Vision Transformer (ViT) [4] để nhận dạng hình anh Không
giống như các mang thần kinh tích chập (CNN) thông thường đã được sử dung dé
nhận dạng hình ảnh trong nhiều năm, mô hình ViT này đã dựa trên kiến trúctransformer ban đầu được đề xuất cho xử lý ngôn ngữ tự nhiên Mô hình ViT sử dụngcác cơ chế self-attention dé xử lý hình ảnh bang cách chia chúng thành các mảng va
xử lý chúng dưới dạng chuỗi mã Cách tiếp cận này cho phép mô hình học hỏi từ cầutrúc tổng thể của hình ảnh, thay vì chỉ các đặc điểm cục bộ, dẫn đến kết quả đáng chú
ý trên các tiêu chuẩn nhận dạng hình ảnh khác nhau Ở nhiều trường hợp khác nhau,
mô hình ViT đã vượt qua các mô hình dựa trên CNN truyền thống về độ chính xáccũng như là tốc độ Bằng cách sử dụng các cơ chế self-attention, ViT có thể nhậnthức toàn bộ hình ảnh, thay vì chỉ các đặc trưng cục bộ Điều này cho phép mô hình
học hỏi từ cau trúc tông thé của hình anh, dẫn đến hiệu suất nhận dạng hình ảnh tốt
hơn Cuối cùng, ViT có thê xử lý các tập dữ liệu lớn và hình ảnh có độ phân giải cao,làm cho nó trở thành một tùy chọn phù hợp cho nhiều tác vụ thị giác máy tính Tuyvậy, ViT cũng có một số nhược điểm cần xem xét Một nhược điểm lớn là yêu cầutài nguyên phân bố cao của nó ViT yêu cầu khả năng tính toán và tài nguyên bộ nhớđáng kê, khiến việc huấn luyện mô hình trên một máy tiêu chuân mà không có quyền
truy cập vào phần cứng chuyên dụng trở nên vô cùng khó khăn Ngoài ra, hoạt động
bên trong của VĩT khó diễn giải hơn so với các mô hình thị giác máy tính truyềnthống như mạng thần kinh tích chập, hạn chế tính minh bạch và khả năng diễn giải
của nó Cuối cùng, hiệu suất của ViT có thé suy giảm trên các tập dữ liệu nhỏ, vì mô
hình này được thiết kế dé học hỏi từ lượng dữ liệu không lồ Tuy nhiên, có thé sửdụng các mô hình light-weight ViT trong các ứng dụng nhận dạng hình anh changhạn như trong lĩnh vực nông nghiệp Phát hiện và chan đoán bệnh cây trồng là mộtthách thức lớn đối với nông dân, nhưng các mô hình light-weight ViT có thé được sử
dụng đê cải thiện độ chính xác và hiệu suât trong lĩnh vực này Các nhà nghiên cứu
Trang 15đang phát triển và khám phá việc sử dụng các mô hình light-weight ViT trong nôngnghiệp bằng cách tăng lượng đữ liệu và tối ưu hóa kiến trúc mô hình để cải thiện hiệu
suất
Nhóm của chúng tôi đã tiến hành nghiên cứu và tìm hiểu nhằm xác định các
mô hình nhận dạng các bệnh cây trồng chính xác nhất và hoạt động tốt nhất phải ké
đến như LeViT, SimpleViT, MobileViT, CrossViT và DeepViT Chúng tôi đã phânloại xử lí và tải các tập dữ liệu lên một máy chủ mà chúng tôi đã sử dụng nhăm khi
huấn luyện các mô hình sẽ sử dụng các tập dữ liệu đồng nhất do chính nhóm nghiên
cứu thu thập và phân loại Sau khi đào tạo, chúng tôi đã tiến hành quá trình lượng tử
hóa Các mô hình này đã được triển khai trên thiết bị di động chứa những mô hình
mà chúng tôi đã nghiên cứu và tìm hiểu
1⁄2 Muc tiêu đề tài
Xây dựng được cơ chế phát hiện bệnh trên lá cây sử dụng các mô hình dựatrên kiến trúc Transformer Đồng thời, đánh giá được khả năng hoạt động của các môhình này trên các thiết bị có phần cứng hạn chế mang lại sự thuận tiện cho nông dântrong việc xác định bệnh cây trồng một cách chính xác và kịp thời, ngay cả ở nhữngkhu vực có kết nối internet hạn chế cũng như xây dựng ứng dụng hoạt động băng
cách cho phép nông dân chụp ảnh cây trồng của họ và tải chúng lên ứng dụng Ứng
dụng này cung cấp cho nông dân thông tin chi tiết về bệnh, bao gồm tên, triệu chứng
và phương pháp điều trị tiềm năng
1.3 Đối tượng và mục tiêu nghiên cứu
Dé phát hiện các bệnh khác nhau trên cây trồng, nhóm đã tìm hiệu cơ chế pháthiện bệnh dựa trên kiến trúc Transformer Hệ thống này sử dụng hình ảnh của lá đểphân loại các bệnh khác nhau Mô hình của nhóm được phát triển hướng tới việc cókhả năng hoạt động trên các thiết bị có tài nguyên thấp như Raspberry Pi, Jetson
Nano, Mobile và các thiết bị khác
1.4 Phuong pháp nghiên cứu
Nhóm sẽ nghiên cứu thành chia thành từng giai đoạn bám sát ở 3 nội dung
chính:
Trang 16Nội dung 1: THU THẬP DỮ LIỆU VÀ TÔ CHỨC DỮ LIỆU
Mục tiêu: Thu thập dữ liệu hình ảnh và xây dựng server quản lý các tập dữ
liệu về bệnh trên lá cây
Phương pháp:
- Chuan bị tập dữ liệu hình ảnh chứa các loại bệnh (ước tính bộ data với nhiều
tập file ảnh nhỏ với dung lượng khoảng 100 GB) từ các nguồn như: Google
Scholar, Kaggle, Mendeley Data, Repositório Digipathos,
- _ Tiến hành phân loại các loại bệnh của cây trồng, thống kê và đánh nhãn cho
các hình ảnh dưới dạng các tập dữ liệu theo cấu trúc bao gồm: một file train.csv
chứa 2 cột ‘image _id’ va ‘label’, một file lưu thông tin các nhãn (tập đuôi là
.Json) và lưu trữ các file hình ảnh vào thư mục tên là ‘train_images’.
- _ Sử dụng VPS Vultr và LongVan SSD Cloud dé lưu trữ các tập dữ liệu và quan
lý các API máy chủ mà người dùng gọi khi yêu cầu thông tin
- May chủ, được xây dựng với các framework web ExpressJS và NodeJS trên
ngôn ngữ lập trình JavaScript, chịu trách nhiệm chính cho việc xử lý các yêu
cầu và trả về tập dữ liệu liên quan đến bat kỳ loại bệnh trên cây
Nội dung 2: XÂY DUNG CƠ CHE PHÁT HIỆN BỆNH TREN LA CAY DUATREN KIEN TRÚC TRANSFORMER
Mục tiêu: Xây dựng được co chế phát hiện bệnh trên lá cây dựa trên kiến trúc
- Sử dụng Google Colab đề tiến hành huấn luyện giúp tăng khả năng training và
tôc độ trong việc nghiên cứu.
Trang 17- Danh giá mô hình khi hoạt động trên máy tính dựa trên các tiêu chí như: độ
chính xác (accuracy), sự mat mát (loss), số khung hình mỗi giây (fps)
Nội dung 3: TRIEN KHAI, ĐÁNH GIÁ CÁC MÔ HÌNH ĐÃ HUAN LUYENTREN CAC THIẾT BỊ HAN CHE PHAN CỨNG
Mục tiêu: Đánh giá và tìm ra được model cho hiệu suất tốt nhất lên các thiết
bị phần cứng hạn chế
Phương pháp:
- _ Chuyên mô hình sang dang phủ hợp với thiết bi phần cứng (quantization )
- Hién thực hệ thống và triển khai mô hình đã huấn luyện trên các thiết bị cụ thé
như Rasberry P1 4 Model B, Jetson Nano và Android Mobile.
- - Đánh giá quá trình inference giữa các model với nhau dựa theo các tiêu chi:
Average response time, bit rate frames per second, reponse time, độ chính xác
khi nhận diện
- _ Xem xét hiệu năng hoạt động giữa các thiết bị triển khai dựa theo các tiêu chí:
mức độ sử dụng tài nguyên (RAM, CPU), số khung hình mỗi giây (fps), mức
độ hoạt động 6n định trong thời gian dài đối với từng mô hình
1.5 Cấu trúc khoá luận
Trong báo cáo này, sẽ trình bày về những cơ sở lý thuyết và kiến thức nền tảng
đã được áp dụng và nghiên cứu trong quá trình thực hiện khóa luận Những nội dung
đó sẽ được trình bày trong báo cáo này theo cấu trúc như sau:
- Chương 1: Mở đầu — Trình bày về lý do chọn đề tài, mục tiêu đề tài, đối
tượng nghiên cứu, mục tiêu nghiên cứu và phương pháp nghiên cứu.
- Chương 2: Cơ sở lý thuyết — Trinh bày về khảo sát các mô hình mà trong
quá trình nghiên cứu đã chọn lọc và tìm hiểu, tìm hiểu về một số công cụ,
thư viện hỗ trợ trong quá trình thực hiện khoá luận.
- Chương 3: Phân tích và thiết kế hệ thống — Trình bày về tổng quan kiến trúc
xây dựng hệ thống và khảo sát các mô hình học sâu tiêu biểu và tốt nhất
trong quá trình thực hiện.
Trang 18- Chương 4: Kết quả thực hiện — Trình bày về tập dữ liệu, môi trường thực
hiện thử nghiệm, kết quả đạt được, minh hoạ kết quả ở nhiều thiết bị khácnhau đặc biệt là kết quả ở các thiết bị có phần cứng hạn chế, thiết bị cậnbiên, mô tả giao diện xây dựng ứng dụng ở thiết bị di động
- Chương 5: Tổng kết - Tổng kết lại khóa luận bằng cách trình bay ý nghĩa
của đồ án và các thành quả đã đạt được, đồng thời đưa ra những nhận xétđánh giá trực quan nhất về hệ thống và những hạn chế còn ton tại trong quátrình nghiên cứu và thực hiện Từ đó, đề xuất các hướng giải quyết, cải thiện
và phát triển cho hệ thống trong tương lai, nhằm nâng cao hiệu qua và khả
năng hoạt động của nó.
Trang 19Chương 2 CƠ SỞ LY THUYET
2.1 Các công trình nghiên cứu liên quan
2.1.1 Các công trình nghiên cứu theo hướng các mô hình học máy cơ bản
Đầu tiên ở phan công trình nghiên cứu các mô hình học máy cơ bản nay, chúng
tôi đã tìm hiểu được tác giả trong bai “Identification of Corn Plant Diseases and Pests
Based on Digital Images using Multinomial Naive Bayes and K-Nearest Neighbor”
[5] đã dựa trên những hình ảnh kỹ thuật số bằng cách sử dung phương pháp
Multinomial Naive Bayes (MNB) va K- Nearest Neighbor Dữ liệu được sử dụng baogồm 761 hình ảnh kỹ thuật số với sáu loại bệnh có hại trên cây ngô Phương phápMNB có độ chính xác 92,72%, Fl-score là 78,17% Đồng thời, phương pháp K-Nearest Neighbor với k = 3 có độ chính xác là 99,54% và Fl-score là 93,59%, Đề
xây dựng khả năng nhận dạng và phân loại với mô hình KNN Kỹ thuật phân loại
K-Nearest Neighbor (KNN) và mạng nơ-ron nhân tạo (ANN) cũng được sử dụng nghiên
cứu trong bài báo “Maize Leaf Diseases Recognition and Classification Based onImaging and Machine Learning Techniques” [6] Tổng cộng có 800 hình ảnh đượcthu thập từ môi trường bang máy ảnh trên thiết bị điện thoại di động, 200 hình ảnh từmỗi loại (bệnh đốm lá xám, bệnh khô van, bệnh thối thân và khoẻ mạnh) Độ chínhxác phân loại tốt nhất đạt được khi sử dụng ANN và hiệu suất tổng thể là 94,4% Bài
bao “Detection of Maize Disease Using Random Forest Classification Algorithm” [7]phát hiện bệnh trên cây trồng bằng các phương pháp trí tuệ nhân tao như Naive Bayes
(NB), Decision Tree (DT), K-Nearest Neighbor (KNN), Support Vector Machine
(SVM) và Random Forest (RF) Trong bài báo này, tác giả so sánh tat cả các phương
pháp trên cơ sở độ chính xác và đề xuất mô hình tốt nhất dé phát hiện bệnh hiệu quả
Thuật toán máy học có tên là Random Forest đạt độ chính xác cao nhất (80,68%) vớitổng số 3823 ảnh và nhãn cho 4 nhóm bệnh Việc thực hiện các phân vùng này đượcthực hiện bang Python 3.3 chạy trên hệ điều hành Windows 7 Bộ xử lý dựa trên X64
có tốc độ 3,2 GHz, RAM có dung lượng 8 GB và loại hệ điều hành 64 bit Ngoài ra,
10
Trang 20bai báo “Maize Leaf Disease Detection and Classification Using Machine Learning Algorithms” [8] tập trung vào các kỹ thuật hoc may có giám sát như Naive Bayes
(NB), Decision Tree (DT), K-Nearest Neighbor (KNN), Support Vector Machine
(SVM), và Random Forest (RF) để phát hiện bệnh trên cây ngô với 3823 hình ảnh và
bốn nhãn loại bệnh bao gồm: bệnh đốm lá xám, bệnh khô van, bệnh thối thân và khoẻ
mạnh Các kỹ thuật phân loại đã được đề cập sử dụng dé phân tích va so sánh nhằmchọn ra mô hình dự đoán các bệnh cây trồng phù hợp nhất cho độ chính xác cao nhất.Thuật toán Random Forest cho kết quả với độ chính xác cao nhất là 79,23% so vớicác kỹ thuật phân loại còn lại Bài báo “Deep neural network features fusion and
selection based on PLS regression with an application for crops diseases
classification” [9] các tác giả nghiên cứu dé xuất kiến trúc có ba giai đoạn chính baogồm: trích xuất các đặc trưng của mô hình học sâu bang cách sử dụng mô hình VGG-
19 convolutional neural network đã được huấn luyện từ trước làm đữ liệu đầu vào, sửdụng phương pháp hợp nhất (fusion method) dữ liệu từ nhiều nguồn khác nhau dựa
trên PLS và cuối cùng là phương pháp lựa chọn đặc trưng dữ liệu dựa trên phân tích
hồi quy khớp bộ phận trên PLS Các đặc trưng phân biệt nhất sau đó được sử dụngcho việc nhận dạng cuối cùng bằng cách sử dụng một bộ phân loại “ensemble baggedtree” dựa trên các kỹ thuật thị giác máy tính đề phát hiện bệnh cây trồng trong nôngnghiệp Mô hình sử dụng hồi quy bình phương nhỏ nhất từng phan (PLS) dé lựa chọncác đặc trưng Độ chính xác trung bình đạt được khi sử dụng phương pháp được đề
xuất là khoảng 90,1% Công trình thử nghiệm đề xuất được đánh giá trên bộ dữ liệu
Plant Village bao gồm hình ảnh 3.852 lá của cả khỏe mạnh và không khỏe mạnh Ảnh
dé huấn luyện gồm 200 ảnh với 4 nhãn: khỏe mạnh, cercospora, bệnh đóm lá và cháy
lá, mỗi nhãn có số lượng là 50 ảnh thu được từ làng thực vật Mohanty Dữ liệu hìnhảnh ngô sử dụng dé lại kích thước 256 x 256 pixel Có 2 bước: quá trình trích xuấtđặc trưng và phân loại dữ liệu Trích xuất đặc trưng thu được các đặc trưng tự động
bằng cách sử dụng mạng nơ-ron tích chập (CNN) Bảy mô hình CNN đã được thử
nghiệm: AlexNet, VGG16, VGG19, GoogleNet, Inception-V3, ResNet50 vàResNet101 Trong khi việc phân loại sử dung phương pháp học máy bao gồm: K-
11
Trang 21Nearest Neighbor (KNN), Decision Tree (DT), va Support Vector Machine (SVM).
Dựa trên kết quả thử nghiệm, mô hình cho kết quả phân loại tốt nhất là AlexNet và
SVM (đã sử dụng kiểm chứng chéo 10 lần) với độ chính xác là 93% Mạng nơ-rontích chập được tối ưu hóa bởi mô-đun chức năng đa kích hoạt (MAF) được đề xuất
trong bài báo “High-Accuracy Detection of Maize Leaf Diseases CNN Based on
Multi-Pathway Activation Function Module” [10] các tác gia đã đề xuất dé phát hiện
4428 ảnh lá ngô bao gồm: lá bình thường, bệnh khô văn, bệnh đóm lá, bệnh cháy 1a.
Độ chính xác của phương pháp được đề xuất trong bộ xác thực đạt 97,41% trên ResNet50 Ngoài ra, tác giả đã phát triển thiết bị phát hiện di động dựa trên nền tảngiOS dé phát hiện bệnh nhanh hơn va dé dàng hơn Trong một bài báo khác, “CornLeaf Diseases Diagnosis Based on K-Means Clustering and Deep Learning” [11] đềxuất một phương pháp dựa trên K-means clustering và một mô hình học sâu cải tiễn
MAF-dé chan đoán chính xác ba bệnh phô biến trên lá ngô: MAF-dém xám, đốm lá, và cháy látrong tong số 900 hình ảnh về bệnh Bài viết này nghiên cứu tác động của các giá tri
k khác nhau (2, 4, 8, 16, 32 và 64) và các mô hình (VGG-16, ResNet18, Inception
v3, VGG-19 và mô hình học sâu cải tiễn) trong chân đoán bệnh ngô Sau năm lần tínhtoán, độ chính xác, khả năng thu hồi và F1 của mô hình được đề xuất ôn định ở khoảng93% Một số bài viết sử dụng định dạng RGB và các đặc trưng xử lý hình ảnh khácnhau dé phát hiện màu sắc Cụ thé, trong “Advanced Machine Learning Algorithm
based System for Crops Leaf Diseases Recognition” [12], tac gia da dé xuất một kiếntrúc bao gồm ba giai đoạn chính: trích xuất đặc trưng bằng cách sử dụng Histogram
Oriented Gradient (HOG), Segmented Fractal Texture Analysis (SFTA) va Local
Ternary Patterns (LTP); giảm chiều đữ liệu bang cách sử dụng phân tích thành phanchính (PCA) và giá trị điểm số dựa trên độ lệch chéo và khía cạnh thông tin; phânloại bằng cách sử dụng các bộ phân loại khác nhau dựa trên các kỹ thuật xử lý ảnh vàhọc máy Hệ thống sử dụng nhiều bộ phân loại thuật toán học máy khác nhau dé phan
loại bao gồm: support vector machine (SVM), k-nearest neighbor (KNN), decision
tree (DT), random forest (RF), va gradient boosting (GB) Bộ dữ liệu Plant Villageđược sử dung dé xác thực phương pháp được đề xuất ở định dang RGB va được thay
12
Trang 22đổi kích thước thành kích thước 256x256 với 3.852 hình ảnh Kiến trúc liên quan đến
việc sử dụng các đặc trưng xử lý hình ảnh khác nhau như RGB, SIFT, SURF, ORB
và HOG dé phát hiện mau sắc và các đặc điểm khác của cây trồng trong “Machine
Learning-based for Automatic Detection of Corn-Plant Diseases Using Image
Processing” [13] sử dụng các phương pháp học máy dé phát hiện bệnh trên cây ngô
ở Indonesia Hiệu suất của các đặc trưng này được đánh giá bang cách sử dụng một
số thuật toán học máy như SVM, DT, RF va NB Kết quả cho thay RGB là kiến trúc
đặc trưng cung cấp nhiều thông tin nhất cho tác vụ này và có độ chính xác tốt nhất
đối với hầu hết các bộ phân loại Bộ dữ liệu được sử dung trong nghiên cứu bao gồm
3.823 hình anh Bai báo “Study on Corn Disease Identification Based on PCA and
SVM” [14] nói về việc sử dung kỹ thuật xử ly anh dé phát hiện và phân loại các bệnhkhác nhau trên lá ngô Kiến trúc được đề xuất liên quan đến việc sử dụng phươngpháp Otsu dé phân đoạn ảnh, tiếp theo là PCA và SVM đề phân loại Nghiên cứu dựatrên bệnh xám lá ngô, bệnh đóm lá, bệnh dém lớn ngô và lá ngô khỏe mạnh Độ chính
xác của phân loại được thử nghiệm trên máy trạm, độ chính xác của 4 bệnh: dém lá
ngô, bệnh xám lá, đóm lá ngô lớn va lá ngô khỏe lần lượt là 90,05%, 92,64%, 91,23%
và 05,78% tương ứng trên 3.823 hình ảnh cua tập dữ liệu Bài viết là một cuộc khảosát các nghiên cứu khác nhau đã cô gang tự động hóa quá trình phát hiện và phân loạibệnh cây trồng bằng cách sử dụng hình ảnh lá Hiệu suất của các kỹ thuật tiên tiếnnhất được phân tích để xác định những kỹ thuật hoạt động tốt trên một số loại cây
trong hoặc loại cây trồng Tác giả đã thảo luận về việc sử dụng mô hình học máy dé
phát hiện dựa trên máy tính để xác định các trên cây trồng trong “Plant Diseases
Detection and Classification using Machine Learning Models” [15] Thuật toán máy
học được sử dung để phân loại là Random Forest Phương pháp đã có thể phát hiện
và phân loại bệnh cây trồng với độ chính xác 98% Bộ dữ liệu được sử dụng trongnghiên cứu với 8000 hình ảnh bao gồm hình ảnh của những chiếc lá bị nhiễm cácbệnh như đốm lá, bệnh cháy lá sớm và bệnh cháy lá muộn Ngoài ra, sử dụng các kỹthuật xử lý hình ảnh và học máy đề phân loại các bệnh trên cây ngô trong “Disease
Classification in Maize Crop using Bag of Features and Multiclass Support Vector
13
Trang 23Machine” [16] được các tác giả thảo luận về việc đề xuất các kiến trúc bao gồm việcthu thập hình ảnh rõ ràng của lá ngô, xử lý chúng dé thu được các đặc trưng túi từ(bag of features) và các đặc trưng về đặc tính văn bản dựa trên lịch sử thống kê và sử
dụng support machine vector (SVM) đa lớp dé phân loại Hình ảnh lá ngô thu được
từ bộ dit liệu Plant Village có 3837 hình anh mẫu lá ngô được sắp xếp thành bốn loại
là bệnh đốm lá Cercospora, bệnh đóm lá xám, bệnh cháy lá và các mẫu lá khỏe mạnh
Mô hình có thê được sử dụng cho cả máy trạm và ứng dụng di động Độ chính xácphân loại bằng cách sử dụng nhóm đặc trưng mang lại độ chính xác cao nhất trung
bình là 83,7% trong khi sử dụng các đặc trưng thống kê kết hợp mang lại 81,3% Bài
báo cho mô hình dự đoán trên tập hợp 200 hình ảnh lá ngô, bằng cách sử dụng SVMthuật toán cho kết quả 70-75% và bằng cách sử dụng ANN nó cho kết quả 55-65%
trong “Plant Disease Identification Using SVM and ANN Algorithms” [17] giúp dự
đoán bệnh ở giai đoạn đầu bằng cách sử dụng thuật toán SVM và ANN để tìm ra kếtquả chính xác.
2.1.2 Các công trình nghiên cứu theo hướng các mô hình học máy ANN
Tiếp theo là các mô hình học máy ANN, đây là một cách đơn giản hóa của các
hệ thống thần kinh trong con người Một mô hình ANN bao gồm các đơn vị tính toángiống như các nơ-ron trong hệ thần kinh sinh học, được gọi là nơ-ron nhân tạo Mỗikết nối giống như các khớp thần kinh trong não sinh học, có thể truyền tín hiệu đếncác tế bào thần kinh khác Nơ-ron nhân tạo nhận tín hiệu và xử lý chúng, sau đó có
thể phát tín hiệu cho các tế bảo thần kinh kết nối với nó Do đó, các mô hình ANN
rất hữu ích trong việc giải quyết nhiều vẫn đề khoa học và kỹ thuật khác nhau Ví dụ
như, bai báo "Deep Learning Approach for Identification of In-Field Diseased Images
of Maize Crop" tác giả đã dé xuất kiến trúc dựa trên khung của mang 'Inception-v3'
Ba mô hình khác nhau đã được huấn luyện bằng cách sử dụng các hình ảnh ngô bị
bệnh được thu thập bằng cách sử dụng phương pháp cơ bản Mô hình hoạt động tốtnhất đạt được độ chính xác phân loại tổng thể là 95,99% với trung bình tỷ lệ thu hồi
là 95,96% trên tập dữ liệu thử nghiệm riêng biệt Các hình ảnh được chụp từ các lĩnhvực thử nghiệm của ICAR-HMR, Ludhiana, An Độ, nhắm vào ba bệnh quan trọng
14
Trang 24Tổng cộng có 5939 hình ảnh kỹ thuật số về cây ngô được thu thập theo cách không
phá hủy Ngoài ra, “Computer-vision classification of corn seed varieties using deep
convolutional neural network” dé xuất một cách tiép cận mới dé phân loại tự động
các giống ngô khác nhau bằng cách sử dụng một mạng nơ-ron tích chập sâu (CNN)
làm bộ trích xuất đặc trưng chung Các đặc trưng trích xuất CNN đã được phân loại
với các mô hình học máy khác nhau như artificial neural network (ANN), cubic support vector machine (SVM), quadratic SVM, weighted k-nearest-neighbor (KNN),
boosted tree, bagged tree, va linear discriminant analysis (LDA) B6 phan loai
CNN-ANN đã cho thay được hiệu suất tốt nhất, phân loại 2250 trường hợp thử nghiệmtrong 26,8 giây với độ chính xác phân loại 98,1%, độ chính xác 98,2%, thu hồi 98,1%
và điểm F1 98,1% Kiến trúc được đề xuất dựa trên mô hình CNN, được sử dụng đểphân loại các giống ngô Mô hình có thể được sử dụng trên cả máy trạm và thiết bị diđộng Nghiên cứu đã sử dụng bộ dữ liệu gồm 9000 hình ảnh hạt ngô Các tác giả đã
đề xuất sử dụng một s6 mô hình khác nhau như ANN, SVM va RF trong bài báo
“Machine Learning Techniques in Plant Conditions Classification and Observation”
[18] dé phân loại các bệnh nhiễm trùng lá cây Hình anh bao gồm các loại bệnh thực
vật khác nhau, chăng hạn như bệnh Alternaria Alternata, Anthracnose, bệnh bạc lá
do vi khuẩn, bệnh đốm lá Cercospora và lá khỏe mạnh Độ chính xác của phươngpháp được đề xuất trong bộ xác thực đạt 96,22% trên SVM và 95,91% trên RF
2.1.3 Các công trình nghiên cứu theo hướng các mô hình CNN và một số mô
hình khác
Cuối cùng là các mô hình kiến trúc mạng nơ-ron tích chập, đây là một loại
mạng nơ-ron sử dung trong deep learning dé xử lý và phân tích dữ liệu hình ảnh Các
tầng tích chập trong CNN cho phép mô hình học được các đặc trưng cục bộ của hình
ảnh, giúp tăng độ chính xác trong quá trình nhận diện đối tượng Vì vậy, CNN được
sử dụng rộng rãi trong các bài toán nhận diện đối tượng trong hình ảnh và cũng được
ap dụng như trong bài bao "Deep convolutional neural network based detectionsystem for real-time corn plant disease recognition" [19], tac giả đã đề xuất một mô
hình CNN được chỉnh sửa dé huấn luyện và triển khai trên thiết bị có tên là Intel
15
Trang 25Movidius Neural Compute Stick, hỗ trợ framework TensorFlow, dựa trên mạng
neural tích chập Mô hình học sâu đạt được độ chính xác 88,46% trong quá trình nhậndiện các bệnh của lá ngô Mô hình này được tối ưu hóa để phù hợp với việc đưa rakết quả theo thời gian thực và có thể chạy trên các thiết bị thông minh độc lập nhưRaspberry Pi, điện thoại thông minh và các drone trên tập dữ liệu 679 hình anh trong
bộ dữ liệu Trong bai báo "Maize leaf disease classification using deep convolutional
neural networks" [20], tac gia dé xuất một kiến trúc mạng nơ-ron tích chập sâu (CNN)dựa trên LeNet được chỉnh sửa dé phân loại bệnh lá ngô Mô hình được huấn luyệnbăng cách sử dụng các hình ảnh từ bộ dữ liệu PlantVillage và có khả năng xác địnhbốn nhãn khác nhau (ba nhãn bệnh và một nhãn khỏe mạnh) Mô hình đạt được độ
chính xác là 97,89% Thực nghiệm được thực hiện trên tổng cộng 4365 hình ảnh với
kích thước 256 x 256 điềm ảnh Các tác giả đã xem xét việc nghiên cứu nhận diện
đối tượng dé xác định các loại bệnh trên lá ngô khác nhau bằng mô hình GoogLeNet
như trong bài "Identification of Maize Leaf Diseases Using Improved Deep
Convolutional Neural Networks" [21] Mô hình được huấn luyện băng cách sử dung
3060 hình anh với các bệnh lá dom xám, đốm nâu, đốm lá curvularia, virus mosaiclùn, đốm lá màu xám, đốm tròn và bệnh cháy lá được thu thập từ các nguồn khácnhau, chang hạn như Plant Village và trang web của Google Độ chính xác kiểm tratop-1 là 98,8%, 98,6%, 98,2%; độ chính xác kiểm tra top-5 là 99,6%, 99,6%, 99,6%.Tác giả đề xuất sử dụng trong nghiên cứu sử dụng mạng nơ-ron tích chập (CNN)
trong bài báo "Detection of disease on corn plants using Convolutional Neural
Network methods" [22] dé chân đoán các bệnh trên cây ngô Mô hình dựa trên một
bộ dir liệu được sử dụng trong nghiên cứu này là một phần của bộ dt liệu PlantVillagevới 3.854 hình ảnh của ba loại bệnh ngô: bệnh cháy lá, đốm lá màu xám va phấn đen
Độ chính xác của mô hình trong việc phát hiện bệnh trên cây ngô là 99% Mang ron tích chập (CNN) và OpenMP được tác giả trong bài báo "Detection of Corn Leaf
nơ-Diseases using Convolutional Neural Network with OpenMP Implementation" [23]
dé xuất sử dụng dé phát hiện bệnh trên lá ngô Mục tiêu của nghiên cứu là xác định
và phân loại loại bệnh hiện diện trên lá thông qua bộ phân loại của kiến trúc mạng
16
Trang 26CNN Mô hình dựa trên một bộ dữ liệu sử dụng trong nghiên cứu nay là một phần
của bộ dir liệu PlantVillage với 3.854 hình ảnh của ba loại bệnh ngô: bệnh cháy lá,bệnh đốm lá màu xám phan den D6 chinh xac cua hé thống trong việc phát hiện bệnhcháy lá, bệnh đốm lá màu xám phan đen lần lượt là 93%, 89% và 89% Mạng nơ-ron
tích chap (CNN) cũng được tác gia trong bài báo "A Computational Procedure for theRecognition and Classification of Maize Leaf Diseases Out of Healthy" [24] dùng dénhận dang và phân loại các bệnh lá ngô Kiến trúc được đề xuất bao gồm một bộ phân
loại được kết nối đầy đủ cho CNN Mô hình được huấn luyện băng cách sử dụng
Neuroph Các hình ảnh được sử dụng cho huấn luyện và kiểm tra được chụp băngmáy ảnh smartphone Google Pixel 3 trong một cánh đồng ngô và được lưu trữ trong
một tập tin trên Google Drive cho 54.306 hình anh với ba loại bệnh lá ngô khác nhau(bệnh phan đen, cháy lá và dém lá màu xám) ngoài lá khỏe mạnh, độ chính xác của
mô hình là 87% Tác giả trong bài báo "Impact of dataset size and variety on the
effectiveness of deep learning and transfer learning for plant disease classification"
[25] đã thử nghiệm tac động lên kích thước va sự da dạng cua tap đữ liệu dé kiểm tra
xem mức độ ảnh hưởng hiệu quả của các kỹ thuật học sâu cho việc nhận dạng bệnhthực vật Kiến trúc được đề xuất dựa trên các mạng nơ-ron tích chập (CNN) Mô hình
đã được huấn luyện bằng cách sử dụng một bộ dữ liệu hình ảnh gồm 165 hình ảnhcủa các triệu chứng được biểu hiện trên các lá Tập dữ liệu được sử dụng trong nghiêncứu nay tương tự như tập dữ liệu được sử dụng trong nghiên cứu của Barbedo (2016).
Cũng như bai báo trên thi tác giả của "A CNN Approach for Corn Leaves DiseaseDetection to support Digital Agricultural System" [26] đề xuất một mô hình CNN cảitiễn dé phát hiện các bệnh lá ngô Mô hình được huấn luyện va kiểm tra trên bốn loạihình ảnh lá ngô, bao gồm ba loại bệnh và một loại khỏe mạnh, đạt độ chính xác phát
hiện trung bình là 98,78% cho ba loại bệnh lá ngô Bộ dữ liệu được sử dụng cho
nghiên cứu này chứa 3.823 hình ảnh lá ngô, được thu thập từ Plant Village Kiến trúc
Efficient Attention Network (EANet) thuộc mạng nơ-ron tích chập (CNN) trong bai
"Efficient attention-based CNN network (EANet) for multi-class maize crop disease
classification" [27] được tac gia nghiên cứu dựa trên mô hình EfficientNetv2 dé nhận
17
Trang 27dạng các bệnh trên cây ngô Phương pháp đề xuất được đánh giá trên các tập dữ liệu
có sẵn có mẫu được chụp dưới các điều kiện môi trường khác nhau như nền khác
nhau, ánh sáng không đồng đều và sự biến đổi về màu sắc Mô hình cho thấy độ chínhxác tông thé là 99,89% cho việc phân loại các bệnh trên nhiều nhãn của cây ngô Các
bộ dir liệu được sử dụng trong nghiên cứu nay là tập dữ liệu bệnh ngô từ cơ sở dữliệu PlantVillage và PlantDoc, chứa tổng cộng 4.188 mẫu với ba loại bệnh lá ngô:bệnh cháy lá, đốm lá màu xám (GLS), bệnh đóm đen (NLB), và lá ngô khỏe mạnh
Kiến trúc được đề xuất dựa trên mô hình MobileNetV2 được tác giả sử dụng trong
bai báo "Identifying plant diseases using deep transfer learning and enhanced
lightweight network" [28] đề xuất một phương pháp dé phát hiện các bệnh thực vậtbăng cách sử dụng mạng nơ-ron tích chập (CNNs) và học chuyền giao nhưng đượcsửa đôi dé tăng khả năng học tập của các chi tiết bệnh nhỏ nhất có trên cây trồng.Phương pháp đề xuất đạt độ chính xác trung bình là 99,85% trên bộ dữ liệuPlantVillage, bao gồm 54.306 hình ảnh lá cây với 26 loại bệnh và 12 loài cây khỏe
mạnh cho 14 loại cây trồng 38 bộ dữ liệu hình ảnh được tải xuống từ cơ sở dữ liệu
Plantvillage, bao gồm táo, khoai tây, nho, cà chua và ngô, v.v Kiến trúc
MobileNetV2 được tác giả trong bài báo "Maize leaf disease identification using deeptransfer convolutional neural networks" [29] nghiên cứu và đề xuất dùng dé sử dụngnhận dạng các bệnh trên cây ngô Kiến trúc này dựa trên một loại mạng nơ-ron tích
chập (CNN) Mô hình được thiết kế dé được sử dụng trên cả máy tram và thiết bị diđộng Nó có độ chính xác 99,11% và có thé nhận dạng đối tượng trong hình ảnh
nhanh chóng Tổng cộng 1189 hình ảnh số của cây ngô được thu thập và kiểm tra trên
một máy trạm Bài báo "Classification of Corn Diseases from Leaf Images Using
Deep Transfer Learning" [30] được tác giả nghiên cứu nhắm đến ứng dung của việctái sử dụng mô hình đã huấn luyện từ trước trong việc phân loại ba loại bệnh ngôcùng với cây ngô khỏe mạnh bằng mười mô hình mang neural tích chập sâu Ngoài
ra, các thử nghiệm được lặp lại 10 lần dé kiểm tra tính biến đổi trong việc chọn lựa
ngẫu nhiên Giá trị độ chính xác tương ứng là 98,6% với 3852 hình ảnh lá ngô được
chia thành bốn loại Kết qua cho thấy việc các mô hình có thé chạy được thiết bị di
18
Trang 28động Bài báo "Y-Net: Identification of Typical Diseases of Corn Leaves Using a
3D-2D Hybrid CNN Model Combined with a Hyperspectral Image Band Selection
Module" [31] dựa trên dữ liệu hình ảnh siêu phd, két hợp lựa chon băng tần, cơ chế
self-attention, trích xuất đặc trưng không gian - phô và phân loại vào một quá trìnhtối ưu hóa thống nhất Y-Net đạt được độ chính xác phân loại tốt nhất so với máyvector hỗ trợ, mang CNN một chiều (1D) và mang CNN hai chiều (2D) Sau khi đãloại bỏ những phần không cần thiết của Y-Net, kích thước mô hình đã giảm xuốngmột phan ba so với kích thước ban đầu, và độ chính xác đạt 98,34% với tổng số 6.264mẫu bệnh được thu thập Nghiên cứu này thực hiện việc nhận dạng lá ngô bằng hệ
thống HSI được sản xuất bởi Head Wall, Hoa Kỳ Hệ thống bao gồm một máy ảnh
siêu phổ, nguồn sáng (đèn halogen có thê điều chỉnh công suất 150 W), bàn di động,hộp nguồn sáng, bộ thu thập và máy tính Nghiên cứu trong bài báo "A Computational
Procedure for the Recognition and Classification of Maize Leaf Diseases Out of
Healthy Leaves Using Convolutional Neural Networks" [24] str dung nguyén ly cua
mang no-ron tich chap (CNN) dé xây dựng một mang đề nhận dạng và phân loại hìnhảnh các bệnh lá ngô được thu thập bằng sử dụng máy ảnh điện thoại thông minh Độchính xác tông thé của CNN là 92,85% với 54.306 hình ảnh của lá cây bị bệnh (bệnh
lá đen, bệnh cháy lá, bệnh dém lá xám) và lá cây khỏe mạnh Các tác giả đã đề xuấtmột phương pháp cho việc phát hiện sớm và chân đoán bệnh trong một số loại cây
theo mùa bang cach su dung kiến trúc hoc sâu, đặc biệt là mạng nơ-ron tích chập
(CNN) như trong bài báo "Classification and Identification of Primitive Kharif Cropsusing Supervised Deep Convolutional Networks" [32] Các mô hình được huấn luyện
dé phát hiện bệnh từ các loại cây theo mùa bị nhiễm bệnh Nghiên cứu sử dung một
cơ sở dữ liệu gồm 600 hình ảnh, bao gồm 200 hình ảnh của các loại cây theo mùa
khác nhau được gắn nhãn với 10 loại bệnh cây trồng Độ chính xác tối đa đạt được là
93,7% băng cách sử dụng kích thước nhóm trung bình với kích thước bộ lọc tích chập
là 64 * 64 * 3 Nghiên cứu so sánh tính khả thi, độ chính xác và hiệu suất của mạngđược đề xuất với các kỹ thuật trích xuất đặc trưng thông thường như support vectormachine, k-nearest neighbor, giải thuật di truyền và mạng neural nhân tạo Tác giả
19
Trang 29nghiên cứu đã đề xuất một kiến trúc mới dựa trên mạng nơ-ron tích chập dày đặc tối
ưu được gọi là DenseNet trên cây ngô có trong bài báo "An Optimized Dense
Convolutional Neural Network Model for Disease Recognition and Classification in
Corn Leaf" [33] Mô hình DenseNet được dé xuất da dat được độ chính xác là 98,06%
với tong cộng 12332 hình ảnh kích thước 250 x 250 pixel được thu thập thủ công từ
các nguồn khác nhau, được chia thành 4 nhãn cây trồng gồm: bệnh cháy lá, bệnh đốm
lã xám và bệnh lá đen và cây khoẻ mạnh Với mục đích phát hiện bệnh và sâu bệnh
trên cây trồng với độ chính xác cao, tác giả trong bài báo "Identification of Diseases
in Corn Leaves using Convolutional Neural Networks and Boosting" [34] sử dụng kỹ
thuật mang no-ron tích chập (CNN) và kỹ thuật boosting trên hình anh lá ngô trong
các trạng thái khác nhau về sức khỏe Sử dụng một tập hợp các bước tăng cường thích
nghi, tác giả đã đạt được độ chính xác là 98% trong việc phân loại 2000 hình ảnh từ
bộ dữ liệu PlantVillage thành bốn loại khác nhau: khỏe mạnh, bệnh cháy lá, bệnh đen
lá và bệnh đốm lá Đây là một cải thiện khoảng 8% về hiệu suất phân loại so với chỉ
sử dung CNN Các tác giả sử dụng đã đề xuất một kiến trúc mạng no-ron
DMS-Robust Alexnet mới có trong bài báo "Maize Leaf Disease Identification Based on
Feature Enhancement and DMS-Robust Alexnet" [35] dé nhận dang các bệnh trên lángô Mô hình này dựa trên kiến trúc cốt lõi Alexnet và kết hợp tích chập co giãn vàtích chập đa tầng để cải thiện việc trích xuất đặc trưng Phương pháp được dé xuấtcho thấy tính ôn định mạnh mẽ đối với các hình ảnh bệnh lá ngô được thu thập trong
môi trường tự nhiên Độ chính xác đạt 98,62% với tổng cộng 7193 hình ảnh Cuối
cùng sẽ là một số bài báo sử dụng định dạng RGB và các đặc trưng xử lý hình ảnhkhác dé phát hiện màu sắc Cụ thé, trong bài báo "Crop conditional Convolutional
Neural Networks for massive multi-crop plant disease classification over cell phone
acquired images taken on real field conditions" [36], tac giả sử dụng mang no-ron
tích chập (CNN) dé phân loại bệnh trên cây trồng Cac mô hình được huấn luyện trênmột tập dữ liệu hơn một trăm nghìn hình ảnh chụp bằng điện thoại di động trong điều
kiện thực tế trên cánh đồng Tập dữ liệu chứa các giai đoạn bệnh gần như băng nhau
của mười bảy bệnh và năm loại cây trông (lúa mì, lúa mạch, ngô, gạo va hat cai) trong
20
Trang 30đó một số bệnh có thê xuất hiện trên cùng một hình ảnh Các mô hình đã được thửnghiệm cho cả nhiệm vụ phân loại đa cây trồng và phân loại riêng cho từng loại câytrồng Mạng phân loại bệnh trên cây trồng có điều kiện dựa trên thông tin ngữ cảnhbang cách nối chuỗi tại cấp vector nhúng đạt được độ chính xác cân bang là 0.98, cảithiện tất cả các phương pháp trước đó và loại bỏ 71% số lần phân loại sai của cácphương pháp trước đó Các mô hình đề xuất có thể được sử dụng cho cả máy trạm và
di động Tập dữ liệu được sử dụng dé xác nhận phương pháp đề xuất ở định dạngRGB va được thay đổi kích thước thành 224x224 với tong cộng 631 hình ảnh Trongnghiên cứu khoa học các tác giả đã đề xuất mô hình được điều chỉnh tinh chỉnh dựa
trên transfer learning EfficientNet trong bài báo "EfficientNet based recognition of
maize diseases by leaf image classification" [37] dé nhận dang va phân loại các bệnhtrên lá ngô Kiến trúc được đề xuất được tăng cường dữ liệu, học từ một mô hìnhEfficientNet được huấn luyện trước và thay thế lớp cuối cùng bằng một bộ phân loạisoftmax 8 lớp Mô hình đề xuất đã cho thay sự cải thiện đáng ké về tốc độ huấn luyện
và độ chính xác nhận dạng so với các mạng khác như VGG-16, Inception-v3 và
Resnet-50, với độ chính xác tối đa là 98,52% Mô hình có thé triển khai trên các thiết
bị di động dé chân đoán và điều trị các bệnh trên lá ngô, giúp giảm thiểu các tốn thất
do bệnh tật gây ra Tên tập dữ liệu đã được sử dụng đề xác nhận phương pháp đề xuất
ở định dang RGB và được thay đôi kích thước thành 224x224 với tổng cộng 9.272hình ảnh Ở một nghiên cứu khoa học khác, tác giả trong bài báo "Automatic
identification of diseases in grains crops through computational approaches: A
review" [38] dé xuất các kiến trúc va mô hình được sử dụng cho việc phát hiện vàphân loại bệnh trên cây, bao gồm tiền xử lý hình ảnh, phân đoạn, trích xuất đặc trưng,lựa chọn đặc trưng và phương pháp phân loại Bài báo sử dụng nhiều mô hình khác
nhau cho việc phát hiện và phân loại bệnh trên cây trồng, bao gồm: Artificial Neural
Networks (ANN), Support Vector Machines (SVM), Decision Trees (DT) ,Random
Forest (RF), K-Nearest Neighbors (KNN), Convolutional Neural Networks (CNN).
Độ chính xác của các phương pháp tính toán được đánh giá dao động từ 70% đến99% Tap dit liệu Plant Village được sử dụng dé xác nhận phương pháp đề xuất ở
21
Trang 31định dạng RGB và được thay đổi kích thước thành 256x256 với tong cộng 3.852 hìnhảnh Ngoài ra ở phần này, chúng tôi giới thiệu một số mô hình khác: Resnet,
YOLOv4, DFCANet, vv Ví dụ ở bài báo "An optimized DenseNet model for corn
leaf disease recognition and classification" [33] dé xuất một mô hình DenseNet được
tối ưu hóa dé nhận dạng và phân loại các bệnh trên lá ngô Mô hình dựa trên kiến trúcmạng nơ-ron tích chập dense Mô hình dé xuất đạt được độ chính xác là 98,06% Tập
dữ liệu được sử dụng trong nghiên cứu bao gồm 12.332 hình ảnh với kích thước 250
x 250 pixel Tác giả đã đề xuất sử dụng thị giác máy tính và học sâu trong bài báo
"Plant Leaf Detection and Disease Recognition using Deep Learning" [39] dé phát
hiện và chan đoán bệnh trên cây trồng Kiến trúc đề xuất bao gồm một bộ dữ liệu đầu
vào, thu thập hình ảnh, tiền xử lý hình ảnh và phân loại hình ảnh Hệ thống dựa trên
các mô hình học sâu được huấn luyện dé nhận dạng các biến thể cây trồng và bệnhtật khác nhau và có thể được sử dụng trên cả máy tính và thiết bị đi động Mô hìnhđược huấn luyện bằng khoảng 35.000 hình anh từ kho dữ liệu Plant Village, với 32
nhãn khác nhau của biến thé cây trồng và bệnh tật với bốn nhãn khác nhau trong bệnh
của cây ngô như cháy lá, đốm lá xám, bệnh dom den và khỏe mạnh Mô hình đạt được
tỷ lệ độ chính xác 96,5% trong quá trình huấn luyện và đạt độ chính xác tối đa 100%
khi thử nghiệm trên các hình ảnh ngẫu nhiên của các cây trồng có bệnh Bài báo
"Real-time System For Identifying Crop Diseases Based on Leaf Images using
Machine Learning" [40] được các tac giả đề xuất một kiến trúc mạng nơ-ron tích chập
sâu cho phân loại bệnh trên cây và một cơ chế phát hiện đơn giản cho xác định và vị
trí các đóm lá Hệ thống được triển khai trên phần cứng nhúng Nvidia Jetson TX1 dé
phát hiện và nhận dạng bệnh trên cây thời gian thực trong lĩnh vực nông nghiệp Độ
chính xác phân loại bệnh đạt khoảng 96,88%, và các mô hình được huấn luyện trên
hình ảnh từ tập dữ liệu PlantVillage với 7.704 hình ảnh Trong khi đó, tác giả trong
bài báo "End-to-End Deep Learning Model for Corn Leaf Disease Classification"
[41] đề xuất một mô hình deep learning end-to-end dé nhận dang lá cây trồng khỏemạnh và bị bệnh Kiến trúc được đề xuất sử dụng hai mạng neural tích chập được tiềnhuấn luyện, EfficientNetB0 và DenseNet121 Mô hình có thể đạt được độ chính xác
22
Trang 32phân loại là 98,56% và được so sánh với các mô hình nơ-ron tích chập được tiền huấn
luyện khác, đặc biệt là ResNet152 và InceptionV3 Tập dữ liệu được sử dụng trong
thử nghiệm là một phần con của tap dữ liệu PlantVillage được lưu trữ trên Kaggle vabao gồm khoảng 217.000 hình ảnh bao gồm 38 loại khác nhau của cả hình ảnh cây
khỏe mạnh và bị bệnh Tuy nhiên, bài báo có tiêu đề "ResNet - Deep Neural Network
architecture for leaf disease classification" [42] đề xuất việc sử dụng kiến trúc ResNetdựa trên học sâu dé nhận dạng bệnh trên cây trồng Mô hình sử dụng mạng nơ-rontích chập (CNN) và được thiết kế chạy trên thiết bị di động Nghiên cứu sử dụng một
tập dữ liệu được gọi là Plantvillage, chứa 54.306 hình ảnh của các loại bệnh khácnhau, và trích xuất các hình ảnh bệnh cho cả chua, khoai tây, ngô với 3.852 hình ảnh,
cà tím và ớt Tổng cộng 30.085 hình ảnh được sử dụng trong nghiên cứu với độ chínhxác của ResNet là 96,6% Ở bài báo "Identification of maize leaf diseases by usingthe SKPSNet-50 convolutional neural network model" [43] đề xuất một mô hìnhmang no-ron tich chap duoc goi la SKPSNet-50 dé nhan dang chính xác các bệnhtrên lá ngô Mô hình dựa trên mạng nơ-ron ResNet-50 nhưng đã thay thế lõi tích chập3x3 bằng một khối xây dựng được cải tiến gọi là Select Kernel-Point-Swish-B(SKPS) và sử dụng hàm kích hoạt Swish-B đề cải thiện việc trích xuất đặc trưng Môhình vượt trội hơn so với các mô hình học máy cô điện và các mô hình mạng nơ-ronsâu khác, đạt được độ chính xác trung bình của quá trình nhận dạng là 92,9% Tổngcộng 1452 ảnh được sử dụng trong quá trình huấn luyện Kiến trúc hệ thống dựa trên
mạng heavy-weight nơ-ron tích chập với tăng cường dữ liệu kết hợp cùng học chuyên
giao và điều chỉnh siêu tham số để phân loại trong bài báo "Corn Leaf Disease
Classification and Detection using Deep Convolutional Neural Network" [44] đã
được các tác giả nghiên cứu dùng dé xác định bệnh trên lá ngô Mô hình sử dụng khối
VGG cho phân loại bệnh và YOLOv4 cho định vị bệnh Hệ thống đề xuất có thê được
sử dụng trên cả máy tính đồng bộ và di động Tập dữ liệu được sử dụng cho các thử
nghiệm có tên là “corn leaf diseases” Nghiên cứu đạt được độ chính xác phân loạibệnh là 99,25% và độ chính xác trung bình truy xuất (mAP) của bệnh là 55,30% các
mô hình CNN truyền thống có độ chính xác thấp và số lượng tham số lớn Ngược lại,
23
Trang 33bài báo "DFCANet: A Novel Lightweight Convolutional Neural Network Model for
Corn Disease Identification" [45] các tác giả đề xuất một mô hình light-weight nhận
dạng bệnh trên lá ngô gọi là DFCANet (Double Fusion block with Coordinate
Attention Network) Kết qua cho thay rằng DFCANet có độ chính xác trung bình là
98,47% với 3271 hình ảnh trong tập dữ liệu PlantDoc được chia thành 6 nhãn câytrồng Các tác giả đề xuất kỹ thuật hoc sâu dé phát hiện bệnh trên cây trồng trong bài
báo "Plant Disease Detection using Deep Transfer Learning" [46] sử dung mô hình
VGGNet-19 đã được huấn luyện trước bằng trọng số của tập dữ liệu "ImageNet" Mô
hình được kiểm tra trên ngô với 3.852 hình ảnh trên Plantvillage, đạt độ chính xác
99,52% sau khi chạy trong 20 epochs.
2.2 Các kỹ thuật liên quan
2.2.1 NodeJS
Theo thông tin ở trang chủ của nhà phát hành NodeJS [47] thì NodeJS là mộtchương trình được viết bằng ngôn ngữ Javascript nhưng được chạy theo thời gianthực dựa trên phương thức bất đồng với nhau và được xây dựng trên nền tang phốbiến như: V8 JavaScript runtime của trình duyệt Chrome, libUV, wv Điều đặc biệt ởđây về Node.js là nó cho phép sử dụng JavaScript dé phát trién các ứng dung backend,
API, các ứng dụng web và các ứng dụng mạng khác Ryan Dahl là người sáng lập vaphát triển Node.js Phiên bản đầu tiên của Node.js được ra mắt vào năm 2009 và kế
từ đó đã được cộng đồng phát triển và nâng cấp liên tục Node.js cũng được hỗ trợbởi nhiều công cụ, thư viện và framework phô biến như Express.Js, Socket.1o, Meteor,
NestJS và nhiều hơn nữa, giúp cho các nhà phát triển có thé phát triển các ứng dụng
mạng một cách nhanh chóng và hiệu quả trên nhiều nền tảng khác nhau
NodeJS có rất nhiều ưu điểm dé hỗ trợ cho việc lập trình back-end dễ dànghon một trong những ưu điểm phải kế đến đó là:
- Xử lý bất đồng bộ: được thiết kế dé xử lý các tác vu I/O không đồng bộ và
các sự kiện trong hệ thong, đảm bảo hiệu suât cao và tiệt kiệm tài nguyên.
24
Trang 34- Khả năng mở rộng: Node.js có khả năng mở rộng dé dàng theo chiều ngang
(horizontal scaling) và chiều dọc (vertical scaling), cho phép xử lý hàng
ngàn kết nối đồng thời một cách hiệu quả
- Sử dụng ngôn ngữ Javascript: đây là một ngôn ngữ phô biến, điều đó giúp
cho các nhà phát triển và lập trình viên dễ tiếp cận bởi vì đó là một ngônngữ phô biến
Server- Wireless Real-time
side proxy connectivity data Chat Bots REST API
ebsSe0e%
Data Big-data and System Monitoring Queued I/O Web scraping Streaming Analytics dashboard Inputs and automation
Hình 2.1 Ung dung của NodeJS
Sử dung NodeJS dé xây dựng các API cho những việc liên quan như tra tập
dữ liệu dữ liệu, xử lí và nhận thông tin từ người dùng từ ứng dụng di động theo thời
gian thực thông qua một số phương thức (POST, GET, PUT, DELETE) một cáchnhanh chóng NodeJS cũng giúp cho việc phát triển ứng dụng di động trở nên linhhoạt và đễ dàng hơn, nhờ vào khả năng xử lý các yêu cầu tương tác đồng thời theo
thời gian thực của nó.
2.2.2 MongoDB
MongoDB [48] là một hệ thống quản ly cơ sở dir liệu phi quan hệ (NoSQL)được viết bằng C++ mục đích là dùng dé lưu trữ và xử lý dữ liệu tài liệu (document-
based data) trong các ứng dụng web và mobile MongoDB lưu trữ dir liệu dưới dạng
tài liệu JSON (BSON - Binary JSON), cho phép các nhà phát triển lưu trữ và truy
xuất đữ liệu một cách linh hoạt, nhanh chóng và thuận tiện
MongoDB là một sản phẩm mã nguồn mở được phát triển bởi MongoDB, Inc
và cộng đồng dùng và đóng góp cho NoSQL MongoDB hỗ trợ nhiều ngôn ngữ lập
25
Trang 35trình như Java, Python, Node.js, Ruby, PHP và nhiều ngôn ngữ khác, giúp cho cácnhà phát triển có thé sử dụng một ngôn ngữ lập trình yêu thích dé truy xuất và xử lý
dir liệu trong MongoDB.
MongoDB có rất nhiều ưu điểm dé hỗ trợ cho việc lưu trữ cơ sở dữ liệu dédàng hơn những ưu điểm được liệt kê là:
- Hiệu suất truy van cao: nhờ vào sử dụng mô hình tài liệu cùng với việc sắp
xếp các thông tin liên quan vào bên trong duy nhất một tài liệu nên các câutruy vấn trả về tất cả thông tin cần thiết trong một cuộc gọi duy nhất đến
cơ sở dữ liệu thay vì sử dụng phép nối như trong các cơ sở đữ liệu thông
thường.
- Cài đặt đơn giản: Sử dụng MongoDB Atlas dé thiết lập và cài đặt các cụm
MongoDB dễ dàng hơn bao giờ hết
- Tiết kiệm chi phí: MongoDB có nhiều gói dành cho cá nhân hoặc doanh
nghiệp nên có thể lựa chọn được gói phù hợp với mục đích sử dụng củaứng dụng giúp tiết kiệm chỉ và tăng tính hiệu quả khi sử dụng
MetadataConfig | =
Sử dụng MongoDB để lưu trữ thông tin người dùng, thông tin về cây trồng và
các dữ liệu cần thiết dé có thể hiển thị đầy đủ trên ứng dung di động
26
Trang 362.2.3 Pytorch
PyTorch [49] là một thư viện mã nguồn mở tensor tối ưu hóa cho học sâu sử
dụng GPU và CPU Được xây dựng bở Facebook AI Research PyTorch thiết kế để
dễ sử dụng và có tính linh hoạt cao, cho phép người dùng tùy chỉnh các phần của mô
hình học sâu một cách dé dàng PyTorch cũng hỗ trợ nhiều các thư viện khác nhautrong học sâu, bao gồm các thư viện cho việc xử ly dit liệu, tao mô hình, tối ưu hóa
và đánh giá mô hình cho phép người dùng xây dựng các mô hình có cấu trúc phứctạp hơn, sử dụng các điều kiện và vòng lặp, và thực hiện các phép tính động trong
quá trình huấn luyện
Pytorch có rất nhiều ưu điểm sử dụng dé huấn luyện va tối ưu mô hình học
máy như:
- _ Tối ưu hóa GPU: PyTorch hỗ trợ tính toán trên GPU, cho phép tăng tốc
độ tính toán và giảm thời gian huấn luyện mô hình
- Thu viện mạnh mẽ: PyTorch cung cấp một loạt các tính năng mạnh mẽ
cho xử lý dữ liệu, tạo mô hình, tối ưu hóa và đánh giá mô hình
- Dễ sử dụng: PyTorch được thiết kế dé đơn giản va dé sử dụng, cho phép
người dùng tập trung vào việc xây dựng và huấn luyện mô hình hơn là
cài đặt các tính năng cơ bản.
Hình 2.3 Các tính năng và ứng dụng của Pytorch
Nhóm chúng tôi sử dụng Pytorch dé huấn luyện và khảo sát các mô hình kiếntrúc Transformer và triển khai các mô hình lên ứng dụng di động
27
Trang 37Chương 3 PHAN TÍCH VÀ THIET KE HE THONG
3.1 Tong quan về hệ thống
Ở phan này, nhóm nghiên cứu của chúng tôi đã phát trién một cơ chế mới dé
xác định lá cây bị bệnh bằng kiến trúc Transformer Bằng cách triển khai mô hình
này trên các thiết bị phần cứng có tài nguyên hạn chế, chúng tôi có thể phát hiện lá
cây bị nhiễm bệnh sớm được minh họa trong Hình 3.1 Phương pháp này cho phép
mô hình hoạt động hiệu quả ngay cả trên các thiết bị có sức mạnh vi xử lý thấp, làmcho việc triển khai và sử dụng trên nhiều nền tang dé dàng hơn Bang cách xác địnhcác van đề bệnh dịch một cách kip thời, công cụ nay có thể giúp ngăn chặn sự lây lan
của bệnh dịch và hỗ trợ quản lý hiệu quả sức khỏe cây Trong hệ thống này, các thiết
bị di động được sử dụng đề đánh giá tình trạng sức khỏe của cây trồng thông qua việc
phát hiện bệnh trên lá cây băng sự kết hợp của các hệ thống như: tải và lưu trữ cáctập dữ liệu trên đám mây, gọi API đề nhận dữ liệu từ dữ liệu lưu trữ đám mây thông
qua API, nhận tập dữ liệu từ cơ sở đám mây, tải mô hình và lưu trữ lên VPS Vultr
thông qua API, nhận mô hình từ VPS Vultr và thông tin từ MongoDB thông qua API,
tải thông tin kết quả lên cơ sở đữ liệu MongoDB thông qua API theo trình tự đượcđánh số và mô tả trong hình ảnh bên dưới với các bước sau đây:
- _ Xây dựng tập dữ liệu: Đầu tiên ở dé tạo ra một bộ dit liệu toàn diện cho việc
xác định bệnh trên cây trồng, nhóm đã thu thập hình ảnh từ nhiều nguồn khác
nhau, bao gồm Google Scholar, Kaggle, Mendeley Data và RepositórioDigipathos Số lượng ước tính của bộ dữ liệu hơn 30 tập đữ liệu với kích thước
tong cộng hơn 100 GB Sau đó, đối với mỗi tập dữ liệu chúng tôi phân loại từnghình ảnh theo loại bệnh cây trồng va gan nhãn chúng với một tệp "train.csv" bên
trong chứa hai cột ("image_id" và "label"), một tệp JSON chứa thông tin nhãn vamột thư mục có tên "train_images" dé lưu trữ các tệp hình ảnh và các tập dữ liệu
sau khi đã xử lí xong sẽ được tải lên và lưu trữ trên máy chủ LongVan SSD (1).
- _ Nền tảng đám mây lưu trữ va cơ sở dữ liệu: Nhóm chúng tôi sử dung VPS
Vultr để lưu trữ mô hình và API, thông tin về cây và thông tin người dùng truy
28
Trang 38xuất trên ứng dụng đi động sẽ được gọi qua các API trên Vultr, các thông tin đó
được lưu trên cơ sở dit liệu MongoDB LongVan SSD Cloud được dùng để lưu
các tập dữ liệu Các hàm API được xây dựng với các framework web ExpressJS
và NodeJS trên ngôn ngữ lập trình JavaScript.
Google Colab: Chúng tôi sử dụng Google Colab đề huấn luyện các mô hình giúptiết kiệm thời gian trong quá trình nghiên cứu và sử dụng các bộ dữ liệu từ máychủ Long Vân (2), (3) trên nền tảng đám mây mà chúng tôi đã thu thập và xây
dựng trước đó dé đảm bảo tính nhất quán và khả năng so sánh mô hình theo các
tiêu chí của chúng tôi bao gồm: độ chính xác, mat mát và số khung hình mỗi giây(FPS) khi hoạt động trên máy tính Các lần thử nghiệm này làm nỗi bật những
mô hình cho hiệu suất tốt Sau đó, chúng tôi sẽ chuyển đôi những mô hình này
dé giúp chúng có thê chạy trên các thiết bị cận biên va song song đó tải các môhình này lên nền tảng đám mây ở đây chúng tôi lưu trữ vào máy chủ VPS Vultr(4) thông qua các API xây dựng trước đó nhằm giúp các thiết bị cận biên có thé
tải xuống một cách đễ dàng nhanh chóng
Thiết bị cận biên: Hệ thống tải các mô hình từ đám mây (5) đã được huấn luyện
từ Google Colab trước đó vào ứng dụng Sau đó ứng dụng sẽ sử dụng camera trênthiết bị di động đề chụp hình ảnh các lá cây, bao gồm vị trí của bất kỳ vết đánhdau nào trên mỗi lá Tiếp theo, các hình anh này được phân tích và phân loại bằngcác mô hình học sâu được gọi là Lightweight VIT, các mô hình đã được huấn
luyện và thiết kế đặc biệt dé triển khai trên các thiết bị di động Kết quả sau khi
xử lí về bệnh mà mô hình đã phát hiện được hiển thị trên ứng dụng cho ngườidùng (6) Bằng cách cung cấp thông tin kịp thời và chính xác về bệnh trên câytrồng, hệ thống của chúng tôi có thé giúp ngăn ngừa các mat mát nghiêm trọng
và thậm chí là that bại về mùa màng Điều này giúp tiết kiệm chi phí đáng ké chonông dân, đồng thời cải thiện sức khỏe và năng suất tổng thể của cây trồng của
họ Các nghiên cứu của chúng tôi hỗ trợ mạnh mẽ cho các giải pháp phát hiện và
quản lý bệnh trên cây trồng trong nông nghiệp một cách bền vững và hiệu quả
hơn.
29
Trang 39(2) (/ (4) Tải mô hình lên VPS Valt
thông qua API
`,
‘Goi API đề nhận dữ liệu từ dữ liệu N 4
lưu tr đâm mây thông qua API ` ø
a “số a
2s A (asa—
ys Tiền xử li dữ liệu “Tập di liệu hình ảnh (1) —— —
Thu thập dữ liệu hình ảnh về các bệnh trên lá cây "MongoDB tử nhiễu nguồn khác Tải lên và lưu trừ.
led trên đâm mây a : \
Máy chú SSD Long Vân \ API + VPS Vultr
Tap dữ liệu online
Backend
fy `
JS) ~
/ Nhậu mô hình từ VPS Vultr và thông.
Z tin từ MongoDB thông qua API
(6) Tài thông tin kết quả lên
Ñ cơ sử dữ liệu MongoDB
NỀN _ thong qua APT
Ứng dung nhận dạng Phát hiện bệnh Phân tích
bệnh trên cây trồng tiên cây
Khoé mạnh
)
'Thiết bị cận biên Ret qua
Hình 3.1 Mô hình hệ thống phát hiện bệnh trên thiết bi di động
3.2 Mô hình học sâu
Trong phan này, chúng sẽ di sâu vào nghiên cứu và thử nghiệm 5 mô hình họcsâu dựa trên kiến trúc Transformer với các thông số được mô tả như bảng 3.1 dưới
đây
Bảng 3.1 Bảng mô tả thông số của các mô hình học sâu
Tên mô hình Kích thước Param(M) FLOPs(G)
Cụ thể hơn kiến trúc các mô hình được trình bày cụ thê ở các mục tiếp theo bêndưới
30
Trang 403.2.1 LeViT
LeViT [50] là một kiến trúc tối ưu hóa được xây dựng dựa trên những thànhcông của ViT và DeiT, đồng thời tích hợp các thành phần hữu ích cho các kiến trúcmạng tích chập Xây dựng thiết kế giảm đáng kê độ phân giải trong hai giai đoạn đầucủa ResNet, mô hình kết hợp các nguyên tắc từ mạng nơ-ron tích chập và kiến trúcdựa trên cơ chế “Attention” Đề tối ưu hóa giữa tốc độ và độ chính xác bang cach su
dụng kích thước embedding nhỏ hon va it attention heads hơn so với các mô hình dựa
trên Transformer khác, chăng hạn như ViT (Vision Transformer) LeViT nhận đầuvào là một hình ảnh có kích thước 224 x 224 và sử dụng 4 lớp tích chập 3x3 dé giảm
độ phân giải mà không mất thông tin quan trọng Dé giảm chi phí tính toán, LeViTgiảm hệ số mở rộng của MLP (multi-layer perceptron) tích chập từ 4 xuống 2 Mô
hình được đánh giá trên tập dữ liệu ImageNet-2012 và vượt qua các mô hình hiện có
-7S pe tonuane _ spt5 9 vonuane g speoy uonueye
Hình 3.2 Sơ đô kiến trúc của LeViT
3.2.2 SimpleViT
SimpleViT [51] là một phiên bản được sửa đổi từ mô hình Vision Transformer
(ViT) gốc, có nhiều cải tiến đáng kể về hiệu suất khi được huấn luyện và đánh giá
trên tập dữ liệu ImageNet-1k sử dụng trên mô hình nhỏ hơn là ViT-S/16 do mô hìnhnày đơn giản và có khả năng mở rộng Kết quả sau khi thử nghiệm chứng minh răng
các kỹ thuật tăng cường dữ liệu là đủ để mô hình Vision Transformer hoạt động tốt
trên tập dữ liệu lớn như ImageNet-1k, chi với các sửa đôi nhỏ như là: sử dụng batch
có kích thước nhỏ hơn, global average-pooling, nhúng vị trí sin-cos 2D cố định va
RandAugment và Mixup có số lượng nhỏ dẫn đến cải thiện hiệu suất.
31