1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp Mạng máy tính và truyền thông: Xây dựng cơ chế phát hiện bệnh trên lá cây dựa trên kiến trúc transformer trên thiết bị hạn chế phần cứng.

83 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Cơ Chế Phát Hiện Bệnh Trên Lá Cây Dựa Trên Kiến Trúc Transformer Trên Thiết Bị Hạn Chế Phần Cứng
Tác giả Nguyen Van Hieu, Le Bui Quang Hop
Người hướng dẫn ThS. Thai Huy Tan, ThS. Tran Thi Dung
Trường học Trường Đại Học Công Nghệ Thông Tin
Chuyên ngành Mạng Máy Tính và Truyền Thông
Thể loại Khóa Luận Tốt Nghiệp
Năm xuất bản 2023
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 83
Dung lượng 48,16 MB

Nội dung

Bài báo “Deep neural network features fusion and selection based on PLS regression with an application for crops diseases classification” [9] các tác giả nghiên cứu dé xuất kiến trúc có

Trang 1

ĐẠI HỌC QUOC GIA TP HO CHÍ MINH

TRUONG DAI HOC CONG NGHE THONG TIN

KHOA MANG MAY TINH VA TRUYEN THONG

NGUYEN VAN HIEU- 19521510

LE BUI QUANG HOP- 19521553

KHOA LUAN TOT NGHIEP

XAY DUNG CO CHE PHAT HIEN BENH TREN LA

CAY DUA TREN KIEN TRUC TRANSFORMER

TREN THIET BI HAN CHE PHAN CUNG

BUILDING A DISEASE DETECTION MECHANISM BASED ON TRANSFORMER ARCHITECTURE ON

RESOURCE CONSTRAINED DEVICES

KỸ SU NGÀNH MẠNG MAY TÍNH VA TRUYEN THONG DU’

LIEU

GIANG VIEN HUONG DAN

ThS THAI HUY TAN va ThS TRAN THI DUNG

TP HO CHÍ MINH, 2023

Trang 2

LỜI CẢM ƠN

Lời đầu tiên, chúng em xin gửi lời cảm ơn chân thành nhất đến ban giám hiệu,quý thầy cô và các nhân viên của trường Đại học Công Nghệ Thông Tin và xin đặcbiệt cảm ơn các thầy cô trong khoa Mạng máy tính và Truyền thông đã tận tình hướngdẫn, giảng dạy cho chúng em những kiến thức bồ ích trong suốt những năm học qua.Những kiến thức này đã giúp chúng em hiểu rõ hơn về lĩnh vực mà chúng em đang

theo đuôi và trang bị cho chúng em nền tảng vững chắc dé tiếp tục phát triển trong

tương lai.

Chúng em xin gửi lời cảm ơn chân thành nhất đến ThS Thái Huy Tân và ThS.Tran Thị Dung, chúng em rat biết on thầy cô đã dành thời gian và công sức dé theodõi và đánh giá bài làm của chúng em, cung cấp cho chúng em những ý kiến xâydựng và giúp chúng em hiéu rõ hơn về đề tài Những lời khuyên và chi dan của thay

cô đã giúp chúng em vượt qua những khó khăn và hoàn thành khóa luận một cách

thành công.

Cuối cùng, chúng em xin gửi lời cảm ơn và sự tri ơn sâu sắc nhất đến gia đình

đã tạo mọi điều kiện có thê về vật chất lẫn tinh than, luôn luôn khích lệ, động viên,

hỗ trợ và là điểm tựa vững chắc nhất cho chúng em trong suốt thời gian học tập vừa

qua.

Khóa luận là thành quả của sự nỗ lực, công sức và tâm huyết của chúng em

trong thời gian qua, việc thiếu sót trong trình bày kiến thức là điều không thể nàotránh khỏi, chúng em kính mong các quý thầy cô xem xét và chỉ bảo giúp chúng em

Chúng em một lần nữa xin chân thành cảm ơn!

TP.HCM, ngày tháng năm 2023

Sinh viên 1 Sinh viên 2

(Ký tên và ghi rõ họ tên) (Ký tên và ghi rõ họ tên)

Trang 3

MỤC LỤC

Chương I MO ĐẦU -52- S5 E22EEEEEEEE221121127121211211 1111.211 3

1.1 Lý do chọn đề tài ¿22-5522 E2 E2EEE21211211211111111211 1111211 E1x xe 3

1.2 Mục tiêu để tài -cccc tt nhieu 61.3 Đối tượng và mục tiêu nghiên cứu -¿- ¿+z+++2x++zx++zxvzxeerxesres 6

1.4 Phương pháp nghiÊn CỨU - Ă 2c 3911131113 11 11 111 vn rệt 6

1.5 Cấu trúc khoá luận : c++t2c+vtttEEktrttEkirtttrtrtrtrirrrrrirrrrrireied 8

Chương2 CO SỞ LÝ THUYÊT 2 22- 22SE+SE+2EE2EESEESEEEEEEEEerkrrkerex 10

2.1 Các công trình nghiên cứu liên quan 5+ + £++k+sexeesxeersserssss 10

2.1.1 Cac công trình nghiên cứu theo hướng các mô hình học máy cơ bản 10

2.1.2 Các công trình nghiên cứu theo hướng các mô hình học máy ANN 14

2.1.3 Các công trình nghiên cứu theo hướng các mô hình CNN và một số mô

BQ 20" 31

Trang 4

4.2 Môi trường thử nghiệm và độ đo đánh giá -. 5c 55c + s+ssssssersss 37

4.3 Kết quả thử nghiệm 2 2+S2+SE+EE2EE2EEE71E21121121171 712112111, 39

4.3.1 Kết quả huấn luyện và đánh giá độ chính xác mô hình 39

4.3.2 Kết quả kiểm thử tốc độ và khả năng hoạt động trên thiết bị hạn chế phần

cúng 43

4.4 Hiện thực ứng dụng di động - - - c3 2+ 321v sirrirreerrerkrree 45

4.4.1 Giao diện màn hình SplashScreen - s6 55 + ‡+sksesserssersres 45 4.4.2 Giao diện màn hình chao mừng s5 + x*svEseeeeeeeeeeeesesse 47

4.4.3 Giao diện màn hình đăng nhập - - 5c 55+ *+*‡+sexse+sexseexssss 48

4.4.4 Giao diện màn hình đăng kí - - 5 5< + ‡++*EExeeerseeeeeeereeeere 50

4.4.5 Giao diện màn hình chính - - 2-5222 + + 3+ 22*#*£+22EE++zeeeeezzeeeezzxe 52

4.4.6 Giao diện tìm kiếm cây trồng hoặc các loại bệnh xuất hiện trên cây 534.4.7 Giao diện lựa chọn model dé quét bệnh trên cây - - -+ 544.4.8 Giao diện màn hình trang cá nhân +55 +3 *+*vx+e+eexssrssss 55

4.4.9 Giao diện màn hình nhận dạng bệnh trên cây - 5555-5552 57

4.4.10 _ Giao diện vườn cây CUA tÔI c3 32311 rirsrrrirerrrrrrrsee 59

4.4.11 Giao diện thêm vườn cây THỐI 5 3+ 3+ E+ssEEseeeeeeeereere 60

4.4.12 Giao diện hiển thị tat cả cây có trong VƯỜN - «se 614.4.13 Giao diện thêm cây IỚI - 5-5225 S21 E*EEseEEeerrerererrrerree 62

Trang 5

Chương 5 TONG KẾT ¿©22-©2+22S+2ExtSEerErerkesrkrrrrees 65

5.1 KẾt luận 2Lc.St t1 2 S121 111111 1111111111111 5121111111111 Etrke 65

Sữa ti:.- -iiểễếi:ỌỌỤ34 665.1.2 Nhược điểm St St+tSESvSEEEEESESEEEEEEEEEEEEEEEEEEEEE111 1111k 665.2 Hướng phat triỂn :- k+Sk+SE+EE2E2E2EEEEEE11211712112112171 11111 66

Trang 6

DANH MỤC HÌNH

Hình 2.1 Ứng dung của NodeJS - 2-52 S£+E2EE2EEEEEEEEEEEEEEEEEEEEErEkrrkerkrrex 25

Hình 2.2 Cách MongoDB hoạt động - - c1 HH re, 26

Hình 2.3 Các tinh năng và ứng dụng của Pytorch «+ ss+ssexsseessers 27

Hình 3.1 Mô hình hệ thống phát hiện bệnh trên thiết bị di động - 30Hình 3.2 Sơ đồ kiến trúc của Le VTT -.-¿-c++2cxvtttrxttttrrrrrrtrrrrrtrrrrrrrrrrre 31

Hình 3.3 Sơ đồ kiến trúc của Simple ViT - 2-52 t+2Et2E2EEeEEeEEerEkrrkerkerkerex 32

Hình 3.4 Sơ đồ kiến trúc của Deep ViT ¿2-2 t+Sx+EE+EE2EE2E2EEEerEerkerkerkrree 33Hình 3.5 Sơ đồ kiến trúc của CrossViT ccsscsssessessesssessessessessessecsessssssessessesssseseeseess 34

Hình 3.6 Sơ đồ kiến trúc của Mobile ViT c2sccccttrktrrrrrrirrrrrrrirrrrrii 35

Hình 4.1 Ảnh minh họa 4 loại bệnh trong tập dữ liệu thử nghiệm 37Hình 4.2 Hình ảnh thê hiện độ chính xác khi tiễn hành training trên tập dir liệu bệnh

CAY DEG NA" /ố£ <.- " 39

Hình 4.3 Hình ảnh thê hiện độ chính xác khi tiến hành validation trên tập dữ liệu

Donh CAY NGG ooo ốc 40

Hình 4.4 Hình ảnh thé hiện độ mat mát khi tiến hành training trên tap đữ liệu bệnh

CAY DEG 0.0 h6 ^*» ốẺố c(Ý sso 40

Hình 4.5 Hình ảnh thê hiện độ mat mát khi tiến hành validation trên tập dữ liệu bệnh

20001777 a 41

Hình 4.6 Giao diện man hình SplashScreen c.ccccessceseesseesseeseeseeeseeeseeeeeeseesseens 46

Hình 4.7 Giao diện màn hình chào mừng - s5 + 33+ ‡++k+veeEseeeeeeerseeers 48 Hình 4.8 Giao diện man hình đăng nhập S5 + ssrssrsee 49 Hình 4.9 Giao diện man hình đăng KkÍ - 5 2S 3213 EEESEreserrresrrerkrree 51

Hình 4.10 Giao diện màn hình chinh cccccecccccsccccesceccesscccesscsccesseecesssseeesseeess 53Hình 4.11 Giao diện màn hình tim kiếm cây trồng và các loại bệnh 54Hình 4.12 Giao điện lựa chọn mô hình đề sử dụng quét bệnh trên cây 55

Hình 4.13 Giao diện màn hình trang cá nhân - - + +++++++sex+seeeseess 56

Hình 4.14 Giao diện màn hình nhận dạng bệnh trên cây và hiển thi thông tin 58

Hình 4.15 Giao diện màn hình vườn cây của tO eee eeeeeeseceseeeeeeeeeeseeeseeereeaeees 59

Trang 7

Hình 4.16 Giao diện màn hình thêm vườn cây HỚI - 5 55 55+ £++£+seesex

Hình 4.17 Giao diện màn hình hién thị tat cả các cây có trong vườn

Hình 4.18 Giao diện màn hình thêm cây mới và tinh trạng của cây

Trang 8

DANH MỤC BANG

Bang 3.1 Bang mô tả thông số của các mô hình học sâu . 5-2 52 s2 30Bảng 4.1 Bảng thể hiện số lượng hình ảnh trong bộ dt liệu đào tạo và xác thực 36Bang 4.2 Bảng thé hiện thuộc tính của thiết bị trong môi trường thí nghiệm 38Bảng 4.3 Bảng thể hiện thông tin của các thiết bị di động được sử dụng trong môi

trường thí nghñiỆm - + + 1k1 1 1v vn nh gu TH Hà HH Hư ng chà 39

Bảng 4.4 Bảng hiển thị so sánh hiệu suất của các mô hình trong tác vụ phân loại

Bang 4.5 Bảng hiển thị kết quả fps (khung hình trên giây) của từng mô hình trên từng

015100 43Bang 4.6 Bảng hiển thị kết quả sử dụng CPU của từng mô hình trên từng thiết bi.44Bảng 4.7 Bảng hiên thị kết quả sử dung RAM của từng mô hình trên từng thiết bi(don

Bảng 4.8 Bảng hiển thị nhiệt độ của từng mô hình trên từng thiết bi(don vị °c) 45

Trang 9

DANH MỤC TU VIET TAT

STT Tir Từ viết tat của

1 ANN Artificial Neural Network

2 API Application Program

Interface

3 AI Artificial Intelligence

4 ViT Vision Transformer

5 DNN Deep neural Network

Trang 10

TOM TAT KHOA LUẬN

Nông nghiệp là một ngành kinh tế rất quan trọng trong việc xây dựng nền kinh

tế và đáp ứng nhu cầu cung cấp thực phâm cho con người Tuy nhiên, bệnh thực vật

là một thách thức lớn đối với nông nghiệp, gây thiệt hại cho cây trồng, giảm sản lượng

va ảnh hưởng tiêu cực đến chất lượng sản phẩm Dé giải quyết van dé này, các công

nghệ thông minh như trí tuệ nhân tao (AI), học máy va Internet of Things (IoT) đã

được áp dụng dé phát hiện bệnh thực vật một cách hiệu qua Một phương pháp được

xem là tiềm năng và hiện đại nhất là sử dụng các mô hình học sâu như ViT là một mô hình học sâu dựa trên kiến trúc Vision Transformer (VIT), đã cáchmạng hóa lĩnh vực trí tuệ nhân tạo và đã cho thấy hiệu suất đáng kê trong các tác vụ

Lightweight-nhận dạng hình ảnh.

Trong khoá luận này nhóm của chúng tôi sẽ trình bay một cơ chế mới dé pháthiện sớm bệnh trên cây trồng sử dụng kiến trúc Transformer Bằng cách triển khai

mô hình trên các thiết bi di động có tài nguyên hạn chế, hệ thống có thé phát hiện lá

cây bị bệnh, ngăn chặn sự lây lan của bệnh và hỗ trợ quản lý sức khỏe cây hiệu quả.

Phương pháp này bao gồm xây dựng một tập dữ liệu toàn diện, sử dụng lưu trữ đám

mây và cơ sở dit liệu, sử dụng Google Colab dé huấn luyện và đánh giá các mô hình

Vision Transformer, và triển khai các mô hình trên các thiết bị di động để phát hiện

bệnh thời gian thực Hệ thống cung cấp thông tin kịp thời và chính xác về bệnh trên

cây trồng, tiết kiệm chi phí đáng ké và cải thiện sức khỏe và năng suất tong thé củacây trồng Phương pháp này đại diện cho một công cụ mạnh mẽ cho quản lý bệnhtrên cây trồng trong nông nghiệp và có tiềm năng hỗ trợ các phương pháp nông nghiệp

bền vững và hiệu quả hơn Nghiên cứu đã tập trung vào việc sử dụng các kiến trúc

mang học sâu phô biến hiện nay như LeViT, SimpleViT, MobileViT, CrossViT và

DeepViT Sau đó tiễn hành các thử nghiệm đầy đủ và chỉ tiết trên các tập dữ liệu thực

tế để đánh giá hiệu suất của các mô hình này trên nhiều loại cây trồng khác nhau Kếtquả nghiên cứu cho thấy, các mô hình này đều cho kết quả rất tốt và có khả năng phát

hiện bệnh chính xác trên các loại cây trông khác nhau.

Trang 11

Sau khi hoàn thành, khoá luận sẽ đề xuất và triển khai các mô hình học sâu déchân đoán bệnh cây trồng chính xác và hiệu quả nhất trên một ứng dụng di động Nhờ

đó, những người nông dân có thé dé dàng và nhanh chóng phát hiện các bệnh trên

cây trồng của minh và thực hiện các biện pháp kip thời dé ngăn chặn sự hư hai chocây trồng của họ Bằng cách sử dụng giải pháp của chúng tôi sẽ giúp nâng cao năngsuất và chất lượng sản phẩm, giảm thiêu thiệt hại do dịch bệnh gây ra, đồng thời dambảo an ninh thực phẩm cho cộng đồng

Trang 12

Chương 1 MỞ ĐẦU

1.1 Lý do chọn đề tài

Nông nghiệp là ngành đóng vai trò quan trọng trong việc xây dựng nền kinh

tế va đáp ứng nhu cầu cung cấp lương thực, thực phẩm cho con người Trong khoảngthời gian từ năm 2000 đến năm 2020, tổng giá trị của ngành nông nghiệp, lâm nghiệp

và đánh bắt cá trên toàn thế giới đã tăng 78% sau khi điều chỉnh theo lạm phát, đạttong cộng 3,6 nghìn tỷ đô la vào năm 2020 Đóng góp lớn nhất cho sự gia tăng này

là Chau A, chiếm ty trọng 64% tổng giá trị gia tăng của thế giới trong các ngành nàyvào năm 2020 Trong khi giá trị gia tăng của nông nghiệp tăng trên toàn cầu vào năm

2020, ngoại trừ ở châu Au, do đại dịch COVID-19, diện tích đất được trang bị chotưới tiêu trên toàn thế giới cũng tăng 20% trong khoảng thời gian này, đạt 349 triệu

ha Phan lớn sự gia tăng này xảy ra ở châu A, chiếm 70% điện tích đất toàn cầu đượctrang bi cho tưới tiêu vào năm 2020 [1] Tuy nhiên, nông nghiệp đang phải đối mặt

với nhiều thách thức, và một trong những thách thức lớn nhất là dịch bệnh trên cây

trong Các loại bệnh trên thực vật có thé gây thiệt hại dang kế cho cây trồng, làm

giảm năng suất và tác động tiêu cực đến chất lượng sản phẩm Trên cây lúa, có thểquan sát thấy một số triệu chứng của bệnh như lá héo, vàng Ua va sọc vàng, cũng như

các vết bệnh trên thân va be lá do bệnh khô van gây ra Mặt khác, bệnh đạo ôn có thể

gây ra bệnh ung trên lá và thân, cuối cùng chuyền sang màu nâu và chết, trong khi

bệnh cháy lá do vi khuẩn có thé dẫn đến cháy ngọn lá và lá bị vàng Tương tự nhưvậy ở cây ngô, các triệu chứng phổ biến của bệnh bao gồm sự hình thành của nốt mụn

trên cây do bệnh than đen gây ra và mụn mủ màu cam đến nâu trên lá do bệnh đóm

lá xám Bệnh cháy lá có thé dẫn đến các vét bệnh hình diéu xì gà trên lá, trong khi

bệnh dom den ở cây ngô có thé gây ra các vết bệnh hình kim cương kéo dài Việc xác

định và hiểu các triệu chứng bệnh trên lúa và ngô có thé khó phát hiện bằng mắtthường Tuy nhiên, điều quan trọng nhất là phải quản lý và phòng ngừa hiệu quả các

bệnh thực vật có thê ảnh hưởng đáng kể đến năng suất cây trồng và sản xuất lương

Trang 13

thực toàn cầu Vì vậy, dé giải quyết van dé này, ngành nông nghiệp đã ứng dụng cáccông nghệ thông minh đề theo dõi cây trồng và phát hiện bệnh cây hiệu quả Nhữngcông nghệ này bao gồm hệ thống cảm biến, trí tuệ nhân tạo, học máy và Internet of

Things.

Trí tuệ nhân tạo (AI) đang ngày càng được áp dung nhiều hơn vào nông

nghiệp, nó cung cấp cho nông dân và người trồng trọt những công cu mới dé tối ưuhóa việc quản lý cây trồng và tăng năng suất Học máy là một nhánh của trí tuệ nhântạo có liên quan đến việc tạo ra các thuật toán và mô hình cho phép máy tính học hỏi

và cải thiện từ những kinh nghiệm đã trải qua mà không cần phải lập trình rõ ràng.

Có nhiều loại học máy khác nhau như học có giám sát, học không giám sát và họctăng cường, mỗi loại đều có các phương pháp và ứng dụng riêng Mạng thần kinhnhân tạo (ANN) là một mô hình học máy được lấy cảm hứng từ các cấu trúc và chứcnăng của bộ não thần kinh con người Các nghiên cứu như trong bài "Deep Learning

Approach for Identification of In-Field Diseased Images of Maize Crop [2]" va bài

"Computer-vision classification of corn seed varieties using deep convolutional

neural network [3]" đã làm nồi bat việc sử dụng các mô hình này dé xác định chínhxác các bệnh thực vật, đặc biệt là ở cây ngô Mạng ANN có một số lợi thế bao gồmkhả năng mô hình hóa các mối quan hệ phi tuyến tính phức tạp giữa đầu vào và đầu

ra, khả năng thích ứng với những thay đổi của dit liệu theo thời gian và khả năng chịu

lỗi dé xử ly dé liệu nhiễu va không đầy đủ Chúng cũng có khả năng khái quát hóatốt dit liệu mới điều đó khiến chúng rat phù hợp cho các nhiệm vụ dự đoán và phân

loại Tuy nhiên, ANN cũng có một số hạn chế, điều này có thể gây khó khăn cho việchiểu các quyết định được đưa ra như thế nào Ngoài ra, việc đảo tạo ANN có thể tốnkém về mặt tính toán và chúng có thể yêu cầu một phần cứng cao cũng như yêu cầumột lượng lớn dữ liệu chất lượng cao đề hoạt động tốt những điều này gây khó khăn

và tốn kém để có được

Học sâu là một tập hợp con của học máy sử dụng mạng thần kinh nhân tạo với

nhiều lớp dé phân tích và trích xuất các đặc trưng phức tạp từ dữ liệu Cách tiếp cận

này đã cách mạng hóa lĩnh vực trí tuệ nhân tạo và máy móc sẽ có quyên thực hiện

Trang 14

các nhiệm vụ mà trước đây vốn chỉ phù hợp với trí thông minh của con người chắng

hạn như là nhận dạng hình ảnh và giọng nói cũng như xử lý ngôn ngữ tự nhiên.

Vào năm 2020, các nhà nghiên cứu của Google đã phát triển một mô hình học

sâu tiên tiến có tên là Vision Transformer (ViT) [4] để nhận dạng hình anh Không

giống như các mang thần kinh tích chập (CNN) thông thường đã được sử dung dé

nhận dạng hình ảnh trong nhiều năm, mô hình ViT này đã dựa trên kiến trúctransformer ban đầu được đề xuất cho xử lý ngôn ngữ tự nhiên Mô hình ViT sử dụngcác cơ chế self-attention dé xử lý hình ảnh bang cách chia chúng thành các mảng va

xử lý chúng dưới dạng chuỗi mã Cách tiếp cận này cho phép mô hình học hỏi từ cầutrúc tổng thể của hình ảnh, thay vì chỉ các đặc điểm cục bộ, dẫn đến kết quả đáng chú

ý trên các tiêu chuẩn nhận dạng hình ảnh khác nhau Ở nhiều trường hợp khác nhau,

mô hình ViT đã vượt qua các mô hình dựa trên CNN truyền thống về độ chính xáccũng như là tốc độ Bằng cách sử dụng các cơ chế self-attention, ViT có thể nhậnthức toàn bộ hình ảnh, thay vì chỉ các đặc trưng cục bộ Điều này cho phép mô hình

học hỏi từ cau trúc tông thé của hình anh, dẫn đến hiệu suất nhận dạng hình ảnh tốt

hơn Cuối cùng, ViT có thê xử lý các tập dữ liệu lớn và hình ảnh có độ phân giải cao,làm cho nó trở thành một tùy chọn phù hợp cho nhiều tác vụ thị giác máy tính Tuyvậy, ViT cũng có một số nhược điểm cần xem xét Một nhược điểm lớn là yêu cầutài nguyên phân bố cao của nó ViT yêu cầu khả năng tính toán và tài nguyên bộ nhớđáng kê, khiến việc huấn luyện mô hình trên một máy tiêu chuân mà không có quyền

truy cập vào phần cứng chuyên dụng trở nên vô cùng khó khăn Ngoài ra, hoạt động

bên trong của VĩT khó diễn giải hơn so với các mô hình thị giác máy tính truyềnthống như mạng thần kinh tích chập, hạn chế tính minh bạch và khả năng diễn giải

của nó Cuối cùng, hiệu suất của ViT có thé suy giảm trên các tập dữ liệu nhỏ, vì mô

hình này được thiết kế dé học hỏi từ lượng dữ liệu không lồ Tuy nhiên, có thé sửdụng các mô hình light-weight ViT trong các ứng dụng nhận dạng hình anh changhạn như trong lĩnh vực nông nghiệp Phát hiện và chan đoán bệnh cây trồng là mộtthách thức lớn đối với nông dân, nhưng các mô hình light-weight ViT có thé được sử

dụng đê cải thiện độ chính xác và hiệu suât trong lĩnh vực này Các nhà nghiên cứu

Trang 15

đang phát triển và khám phá việc sử dụng các mô hình light-weight ViT trong nôngnghiệp bằng cách tăng lượng đữ liệu và tối ưu hóa kiến trúc mô hình để cải thiện hiệu

suất

Nhóm của chúng tôi đã tiến hành nghiên cứu và tìm hiểu nhằm xác định các

mô hình nhận dạng các bệnh cây trồng chính xác nhất và hoạt động tốt nhất phải ké

đến như LeViT, SimpleViT, MobileViT, CrossViT và DeepViT Chúng tôi đã phânloại xử lí và tải các tập dữ liệu lên một máy chủ mà chúng tôi đã sử dụng nhăm khi

huấn luyện các mô hình sẽ sử dụng các tập dữ liệu đồng nhất do chính nhóm nghiên

cứu thu thập và phân loại Sau khi đào tạo, chúng tôi đã tiến hành quá trình lượng tử

hóa Các mô hình này đã được triển khai trên thiết bị di động chứa những mô hình

mà chúng tôi đã nghiên cứu và tìm hiểu

1⁄2 Muc tiêu đề tài

Xây dựng được cơ chế phát hiện bệnh trên lá cây sử dụng các mô hình dựatrên kiến trúc Transformer Đồng thời, đánh giá được khả năng hoạt động của các môhình này trên các thiết bị có phần cứng hạn chế mang lại sự thuận tiện cho nông dântrong việc xác định bệnh cây trồng một cách chính xác và kịp thời, ngay cả ở nhữngkhu vực có kết nối internet hạn chế cũng như xây dựng ứng dụng hoạt động băng

cách cho phép nông dân chụp ảnh cây trồng của họ và tải chúng lên ứng dụng Ứng

dụng này cung cấp cho nông dân thông tin chi tiết về bệnh, bao gồm tên, triệu chứng

và phương pháp điều trị tiềm năng

1.3 Đối tượng và mục tiêu nghiên cứu

Dé phát hiện các bệnh khác nhau trên cây trồng, nhóm đã tìm hiệu cơ chế pháthiện bệnh dựa trên kiến trúc Transformer Hệ thống này sử dụng hình ảnh của lá đểphân loại các bệnh khác nhau Mô hình của nhóm được phát triển hướng tới việc cókhả năng hoạt động trên các thiết bị có tài nguyên thấp như Raspberry Pi, Jetson

Nano, Mobile và các thiết bị khác

1.4 Phuong pháp nghiên cứu

Nhóm sẽ nghiên cứu thành chia thành từng giai đoạn bám sát ở 3 nội dung

chính:

Trang 16

Nội dung 1: THU THẬP DỮ LIỆU VÀ TÔ CHỨC DỮ LIỆU

Mục tiêu: Thu thập dữ liệu hình ảnh và xây dựng server quản lý các tập dữ

liệu về bệnh trên lá cây

Phương pháp:

- Chuan bị tập dữ liệu hình ảnh chứa các loại bệnh (ước tính bộ data với nhiều

tập file ảnh nhỏ với dung lượng khoảng 100 GB) từ các nguồn như: Google

Scholar, Kaggle, Mendeley Data, Repositório Digipathos,

- _ Tiến hành phân loại các loại bệnh của cây trồng, thống kê và đánh nhãn cho

các hình ảnh dưới dạng các tập dữ liệu theo cấu trúc bao gồm: một file train.csv

chứa 2 cột ‘image _id’ va ‘label’, một file lưu thông tin các nhãn (tập đuôi là

.Json) và lưu trữ các file hình ảnh vào thư mục tên là ‘train_images’.

- _ Sử dụng VPS Vultr và LongVan SSD Cloud dé lưu trữ các tập dữ liệu và quan

lý các API máy chủ mà người dùng gọi khi yêu cầu thông tin

- May chủ, được xây dựng với các framework web ExpressJS và NodeJS trên

ngôn ngữ lập trình JavaScript, chịu trách nhiệm chính cho việc xử lý các yêu

cầu và trả về tập dữ liệu liên quan đến bat kỳ loại bệnh trên cây

Nội dung 2: XÂY DUNG CƠ CHE PHÁT HIỆN BỆNH TREN LA CAY DUATREN KIEN TRÚC TRANSFORMER

Mục tiêu: Xây dựng được co chế phát hiện bệnh trên lá cây dựa trên kiến trúc

- Sử dụng Google Colab đề tiến hành huấn luyện giúp tăng khả năng training và

tôc độ trong việc nghiên cứu.

Trang 17

- Danh giá mô hình khi hoạt động trên máy tính dựa trên các tiêu chí như: độ

chính xác (accuracy), sự mat mát (loss), số khung hình mỗi giây (fps)

Nội dung 3: TRIEN KHAI, ĐÁNH GIÁ CÁC MÔ HÌNH ĐÃ HUAN LUYENTREN CAC THIẾT BỊ HAN CHE PHAN CỨNG

Mục tiêu: Đánh giá và tìm ra được model cho hiệu suất tốt nhất lên các thiết

bị phần cứng hạn chế

Phương pháp:

- _ Chuyên mô hình sang dang phủ hợp với thiết bi phần cứng (quantization )

- Hién thực hệ thống và triển khai mô hình đã huấn luyện trên các thiết bị cụ thé

như Rasberry P1 4 Model B, Jetson Nano và Android Mobile.

- - Đánh giá quá trình inference giữa các model với nhau dựa theo các tiêu chi:

Average response time, bit rate frames per second, reponse time, độ chính xác

khi nhận diện

- _ Xem xét hiệu năng hoạt động giữa các thiết bị triển khai dựa theo các tiêu chí:

mức độ sử dụng tài nguyên (RAM, CPU), số khung hình mỗi giây (fps), mức

độ hoạt động 6n định trong thời gian dài đối với từng mô hình

1.5 Cấu trúc khoá luận

Trong báo cáo này, sẽ trình bày về những cơ sở lý thuyết và kiến thức nền tảng

đã được áp dụng và nghiên cứu trong quá trình thực hiện khóa luận Những nội dung

đó sẽ được trình bày trong báo cáo này theo cấu trúc như sau:

- Chương 1: Mở đầu — Trình bày về lý do chọn đề tài, mục tiêu đề tài, đối

tượng nghiên cứu, mục tiêu nghiên cứu và phương pháp nghiên cứu.

- Chương 2: Cơ sở lý thuyết — Trinh bày về khảo sát các mô hình mà trong

quá trình nghiên cứu đã chọn lọc và tìm hiểu, tìm hiểu về một số công cụ,

thư viện hỗ trợ trong quá trình thực hiện khoá luận.

- Chương 3: Phân tích và thiết kế hệ thống — Trình bày về tổng quan kiến trúc

xây dựng hệ thống và khảo sát các mô hình học sâu tiêu biểu và tốt nhất

trong quá trình thực hiện.

Trang 18

- Chương 4: Kết quả thực hiện — Trình bày về tập dữ liệu, môi trường thực

hiện thử nghiệm, kết quả đạt được, minh hoạ kết quả ở nhiều thiết bị khácnhau đặc biệt là kết quả ở các thiết bị có phần cứng hạn chế, thiết bị cậnbiên, mô tả giao diện xây dựng ứng dụng ở thiết bị di động

- Chương 5: Tổng kết - Tổng kết lại khóa luận bằng cách trình bay ý nghĩa

của đồ án và các thành quả đã đạt được, đồng thời đưa ra những nhận xétđánh giá trực quan nhất về hệ thống và những hạn chế còn ton tại trong quátrình nghiên cứu và thực hiện Từ đó, đề xuất các hướng giải quyết, cải thiện

và phát triển cho hệ thống trong tương lai, nhằm nâng cao hiệu qua và khả

năng hoạt động của nó.

Trang 19

Chương 2 CƠ SỞ LY THUYET

2.1 Các công trình nghiên cứu liên quan

2.1.1 Các công trình nghiên cứu theo hướng các mô hình học máy cơ bản

Đầu tiên ở phan công trình nghiên cứu các mô hình học máy cơ bản nay, chúng

tôi đã tìm hiểu được tác giả trong bai “Identification of Corn Plant Diseases and Pests

Based on Digital Images using Multinomial Naive Bayes and K-Nearest Neighbor”

[5] đã dựa trên những hình ảnh kỹ thuật số bằng cách sử dung phương pháp

Multinomial Naive Bayes (MNB) va K- Nearest Neighbor Dữ liệu được sử dụng baogồm 761 hình ảnh kỹ thuật số với sáu loại bệnh có hại trên cây ngô Phương phápMNB có độ chính xác 92,72%, Fl-score là 78,17% Đồng thời, phương pháp K-Nearest Neighbor với k = 3 có độ chính xác là 99,54% và Fl-score là 93,59%, Đề

xây dựng khả năng nhận dạng và phân loại với mô hình KNN Kỹ thuật phân loại

K-Nearest Neighbor (KNN) và mạng nơ-ron nhân tạo (ANN) cũng được sử dụng nghiên

cứu trong bài báo “Maize Leaf Diseases Recognition and Classification Based onImaging and Machine Learning Techniques” [6] Tổng cộng có 800 hình ảnh đượcthu thập từ môi trường bang máy ảnh trên thiết bị điện thoại di động, 200 hình ảnh từmỗi loại (bệnh đốm lá xám, bệnh khô van, bệnh thối thân và khoẻ mạnh) Độ chínhxác phân loại tốt nhất đạt được khi sử dụng ANN và hiệu suất tổng thể là 94,4% Bài

bao “Detection of Maize Disease Using Random Forest Classification Algorithm” [7]phát hiện bệnh trên cây trồng bằng các phương pháp trí tuệ nhân tao như Naive Bayes

(NB), Decision Tree (DT), K-Nearest Neighbor (KNN), Support Vector Machine

(SVM) và Random Forest (RF) Trong bài báo này, tác giả so sánh tat cả các phương

pháp trên cơ sở độ chính xác và đề xuất mô hình tốt nhất dé phát hiện bệnh hiệu quả

Thuật toán máy học có tên là Random Forest đạt độ chính xác cao nhất (80,68%) vớitổng số 3823 ảnh và nhãn cho 4 nhóm bệnh Việc thực hiện các phân vùng này đượcthực hiện bang Python 3.3 chạy trên hệ điều hành Windows 7 Bộ xử lý dựa trên X64

có tốc độ 3,2 GHz, RAM có dung lượng 8 GB và loại hệ điều hành 64 bit Ngoài ra,

10

Trang 20

bai báo “Maize Leaf Disease Detection and Classification Using Machine Learning Algorithms” [8] tập trung vào các kỹ thuật hoc may có giám sát như Naive Bayes

(NB), Decision Tree (DT), K-Nearest Neighbor (KNN), Support Vector Machine

(SVM), và Random Forest (RF) để phát hiện bệnh trên cây ngô với 3823 hình ảnh và

bốn nhãn loại bệnh bao gồm: bệnh đốm lá xám, bệnh khô van, bệnh thối thân và khoẻ

mạnh Các kỹ thuật phân loại đã được đề cập sử dụng dé phân tích va so sánh nhằmchọn ra mô hình dự đoán các bệnh cây trồng phù hợp nhất cho độ chính xác cao nhất.Thuật toán Random Forest cho kết quả với độ chính xác cao nhất là 79,23% so vớicác kỹ thuật phân loại còn lại Bài báo “Deep neural network features fusion and

selection based on PLS regression with an application for crops diseases

classification” [9] các tác giả nghiên cứu dé xuất kiến trúc có ba giai đoạn chính baogồm: trích xuất các đặc trưng của mô hình học sâu bang cách sử dụng mô hình VGG-

19 convolutional neural network đã được huấn luyện từ trước làm đữ liệu đầu vào, sửdụng phương pháp hợp nhất (fusion method) dữ liệu từ nhiều nguồn khác nhau dựa

trên PLS và cuối cùng là phương pháp lựa chọn đặc trưng dữ liệu dựa trên phân tích

hồi quy khớp bộ phận trên PLS Các đặc trưng phân biệt nhất sau đó được sử dụngcho việc nhận dạng cuối cùng bằng cách sử dụng một bộ phân loại “ensemble baggedtree” dựa trên các kỹ thuật thị giác máy tính đề phát hiện bệnh cây trồng trong nôngnghiệp Mô hình sử dụng hồi quy bình phương nhỏ nhất từng phan (PLS) dé lựa chọncác đặc trưng Độ chính xác trung bình đạt được khi sử dụng phương pháp được đề

xuất là khoảng 90,1% Công trình thử nghiệm đề xuất được đánh giá trên bộ dữ liệu

Plant Village bao gồm hình ảnh 3.852 lá của cả khỏe mạnh và không khỏe mạnh Ảnh

dé huấn luyện gồm 200 ảnh với 4 nhãn: khỏe mạnh, cercospora, bệnh đóm lá và cháy

lá, mỗi nhãn có số lượng là 50 ảnh thu được từ làng thực vật Mohanty Dữ liệu hìnhảnh ngô sử dụng dé lại kích thước 256 x 256 pixel Có 2 bước: quá trình trích xuấtđặc trưng và phân loại dữ liệu Trích xuất đặc trưng thu được các đặc trưng tự động

bằng cách sử dụng mạng nơ-ron tích chập (CNN) Bảy mô hình CNN đã được thử

nghiệm: AlexNet, VGG16, VGG19, GoogleNet, Inception-V3, ResNet50 vàResNet101 Trong khi việc phân loại sử dung phương pháp học máy bao gồm: K-

11

Trang 21

Nearest Neighbor (KNN), Decision Tree (DT), va Support Vector Machine (SVM).

Dựa trên kết quả thử nghiệm, mô hình cho kết quả phân loại tốt nhất là AlexNet và

SVM (đã sử dụng kiểm chứng chéo 10 lần) với độ chính xác là 93% Mạng nơ-rontích chập được tối ưu hóa bởi mô-đun chức năng đa kích hoạt (MAF) được đề xuất

trong bài báo “High-Accuracy Detection of Maize Leaf Diseases CNN Based on

Multi-Pathway Activation Function Module” [10] các tác gia đã đề xuất dé phát hiện

4428 ảnh lá ngô bao gồm: lá bình thường, bệnh khô văn, bệnh đóm lá, bệnh cháy 1a.

Độ chính xác của phương pháp được đề xuất trong bộ xác thực đạt 97,41% trên ResNet50 Ngoài ra, tác giả đã phát triển thiết bị phát hiện di động dựa trên nền tảngiOS dé phát hiện bệnh nhanh hơn va dé dàng hơn Trong một bài báo khác, “CornLeaf Diseases Diagnosis Based on K-Means Clustering and Deep Learning” [11] đềxuất một phương pháp dựa trên K-means clustering và một mô hình học sâu cải tiễn

MAF-dé chan đoán chính xác ba bệnh phô biến trên lá ngô: MAF-dém xám, đốm lá, và cháy látrong tong số 900 hình ảnh về bệnh Bài viết này nghiên cứu tác động của các giá tri

k khác nhau (2, 4, 8, 16, 32 và 64) và các mô hình (VGG-16, ResNet18, Inception

v3, VGG-19 và mô hình học sâu cải tiễn) trong chân đoán bệnh ngô Sau năm lần tínhtoán, độ chính xác, khả năng thu hồi và F1 của mô hình được đề xuất ôn định ở khoảng93% Một số bài viết sử dụng định dạng RGB và các đặc trưng xử lý hình ảnh khácnhau dé phát hiện màu sắc Cụ thé, trong “Advanced Machine Learning Algorithm

based System for Crops Leaf Diseases Recognition” [12], tac gia da dé xuất một kiếntrúc bao gồm ba giai đoạn chính: trích xuất đặc trưng bằng cách sử dụng Histogram

Oriented Gradient (HOG), Segmented Fractal Texture Analysis (SFTA) va Local

Ternary Patterns (LTP); giảm chiều đữ liệu bang cách sử dụng phân tích thành phanchính (PCA) và giá trị điểm số dựa trên độ lệch chéo và khía cạnh thông tin; phânloại bằng cách sử dụng các bộ phân loại khác nhau dựa trên các kỹ thuật xử lý ảnh vàhọc máy Hệ thống sử dụng nhiều bộ phân loại thuật toán học máy khác nhau dé phan

loại bao gồm: support vector machine (SVM), k-nearest neighbor (KNN), decision

tree (DT), random forest (RF), va gradient boosting (GB) Bộ dữ liệu Plant Villageđược sử dung dé xác thực phương pháp được đề xuất ở định dang RGB va được thay

12

Trang 22

đổi kích thước thành kích thước 256x256 với 3.852 hình ảnh Kiến trúc liên quan đến

việc sử dụng các đặc trưng xử lý hình ảnh khác nhau như RGB, SIFT, SURF, ORB

và HOG dé phát hiện mau sắc và các đặc điểm khác của cây trồng trong “Machine

Learning-based for Automatic Detection of Corn-Plant Diseases Using Image

Processing” [13] sử dụng các phương pháp học máy dé phát hiện bệnh trên cây ngô

ở Indonesia Hiệu suất của các đặc trưng này được đánh giá bang cách sử dụng một

số thuật toán học máy như SVM, DT, RF va NB Kết quả cho thay RGB là kiến trúc

đặc trưng cung cấp nhiều thông tin nhất cho tác vụ này và có độ chính xác tốt nhất

đối với hầu hết các bộ phân loại Bộ dữ liệu được sử dung trong nghiên cứu bao gồm

3.823 hình anh Bai báo “Study on Corn Disease Identification Based on PCA and

SVM” [14] nói về việc sử dung kỹ thuật xử ly anh dé phát hiện và phân loại các bệnhkhác nhau trên lá ngô Kiến trúc được đề xuất liên quan đến việc sử dụng phươngpháp Otsu dé phân đoạn ảnh, tiếp theo là PCA và SVM đề phân loại Nghiên cứu dựatrên bệnh xám lá ngô, bệnh đóm lá, bệnh dém lớn ngô và lá ngô khỏe mạnh Độ chính

xác của phân loại được thử nghiệm trên máy trạm, độ chính xác của 4 bệnh: dém lá

ngô, bệnh xám lá, đóm lá ngô lớn va lá ngô khỏe lần lượt là 90,05%, 92,64%, 91,23%

và 05,78% tương ứng trên 3.823 hình ảnh cua tập dữ liệu Bài viết là một cuộc khảosát các nghiên cứu khác nhau đã cô gang tự động hóa quá trình phát hiện và phân loạibệnh cây trồng bằng cách sử dụng hình ảnh lá Hiệu suất của các kỹ thuật tiên tiếnnhất được phân tích để xác định những kỹ thuật hoạt động tốt trên một số loại cây

trong hoặc loại cây trồng Tác giả đã thảo luận về việc sử dụng mô hình học máy dé

phát hiện dựa trên máy tính để xác định các trên cây trồng trong “Plant Diseases

Detection and Classification using Machine Learning Models” [15] Thuật toán máy

học được sử dung để phân loại là Random Forest Phương pháp đã có thể phát hiện

và phân loại bệnh cây trồng với độ chính xác 98% Bộ dữ liệu được sử dụng trongnghiên cứu với 8000 hình ảnh bao gồm hình ảnh của những chiếc lá bị nhiễm cácbệnh như đốm lá, bệnh cháy lá sớm và bệnh cháy lá muộn Ngoài ra, sử dụng các kỹthuật xử lý hình ảnh và học máy đề phân loại các bệnh trên cây ngô trong “Disease

Classification in Maize Crop using Bag of Features and Multiclass Support Vector

13

Trang 23

Machine” [16] được các tác giả thảo luận về việc đề xuất các kiến trúc bao gồm việcthu thập hình ảnh rõ ràng của lá ngô, xử lý chúng dé thu được các đặc trưng túi từ(bag of features) và các đặc trưng về đặc tính văn bản dựa trên lịch sử thống kê và sử

dụng support machine vector (SVM) đa lớp dé phân loại Hình ảnh lá ngô thu được

từ bộ dit liệu Plant Village có 3837 hình anh mẫu lá ngô được sắp xếp thành bốn loại

là bệnh đốm lá Cercospora, bệnh đóm lá xám, bệnh cháy lá và các mẫu lá khỏe mạnh

Mô hình có thê được sử dụng cho cả máy trạm và ứng dụng di động Độ chính xácphân loại bằng cách sử dụng nhóm đặc trưng mang lại độ chính xác cao nhất trung

bình là 83,7% trong khi sử dụng các đặc trưng thống kê kết hợp mang lại 81,3% Bài

báo cho mô hình dự đoán trên tập hợp 200 hình ảnh lá ngô, bằng cách sử dụng SVMthuật toán cho kết quả 70-75% và bằng cách sử dụng ANN nó cho kết quả 55-65%

trong “Plant Disease Identification Using SVM and ANN Algorithms” [17] giúp dự

đoán bệnh ở giai đoạn đầu bằng cách sử dụng thuật toán SVM và ANN để tìm ra kếtquả chính xác.

2.1.2 Các công trình nghiên cứu theo hướng các mô hình học máy ANN

Tiếp theo là các mô hình học máy ANN, đây là một cách đơn giản hóa của các

hệ thống thần kinh trong con người Một mô hình ANN bao gồm các đơn vị tính toángiống như các nơ-ron trong hệ thần kinh sinh học, được gọi là nơ-ron nhân tạo Mỗikết nối giống như các khớp thần kinh trong não sinh học, có thể truyền tín hiệu đếncác tế bào thần kinh khác Nơ-ron nhân tạo nhận tín hiệu và xử lý chúng, sau đó có

thể phát tín hiệu cho các tế bảo thần kinh kết nối với nó Do đó, các mô hình ANN

rất hữu ích trong việc giải quyết nhiều vẫn đề khoa học và kỹ thuật khác nhau Ví dụ

như, bai báo "Deep Learning Approach for Identification of In-Field Diseased Images

of Maize Crop" tác giả đã dé xuất kiến trúc dựa trên khung của mang 'Inception-v3'

Ba mô hình khác nhau đã được huấn luyện bằng cách sử dụng các hình ảnh ngô bị

bệnh được thu thập bằng cách sử dụng phương pháp cơ bản Mô hình hoạt động tốtnhất đạt được độ chính xác phân loại tổng thể là 95,99% với trung bình tỷ lệ thu hồi

là 95,96% trên tập dữ liệu thử nghiệm riêng biệt Các hình ảnh được chụp từ các lĩnhvực thử nghiệm của ICAR-HMR, Ludhiana, An Độ, nhắm vào ba bệnh quan trọng

14

Trang 24

Tổng cộng có 5939 hình ảnh kỹ thuật số về cây ngô được thu thập theo cách không

phá hủy Ngoài ra, “Computer-vision classification of corn seed varieties using deep

convolutional neural network” dé xuất một cách tiép cận mới dé phân loại tự động

các giống ngô khác nhau bằng cách sử dụng một mạng nơ-ron tích chập sâu (CNN)

làm bộ trích xuất đặc trưng chung Các đặc trưng trích xuất CNN đã được phân loại

với các mô hình học máy khác nhau như artificial neural network (ANN), cubic support vector machine (SVM), quadratic SVM, weighted k-nearest-neighbor (KNN),

boosted tree, bagged tree, va linear discriminant analysis (LDA) B6 phan loai

CNN-ANN đã cho thay được hiệu suất tốt nhất, phân loại 2250 trường hợp thử nghiệmtrong 26,8 giây với độ chính xác phân loại 98,1%, độ chính xác 98,2%, thu hồi 98,1%

và điểm F1 98,1% Kiến trúc được đề xuất dựa trên mô hình CNN, được sử dụng đểphân loại các giống ngô Mô hình có thể được sử dụng trên cả máy trạm và thiết bị diđộng Nghiên cứu đã sử dụng bộ dữ liệu gồm 9000 hình ảnh hạt ngô Các tác giả đã

đề xuất sử dụng một s6 mô hình khác nhau như ANN, SVM va RF trong bài báo

“Machine Learning Techniques in Plant Conditions Classification and Observation”

[18] dé phân loại các bệnh nhiễm trùng lá cây Hình anh bao gồm các loại bệnh thực

vật khác nhau, chăng hạn như bệnh Alternaria Alternata, Anthracnose, bệnh bạc lá

do vi khuẩn, bệnh đốm lá Cercospora và lá khỏe mạnh Độ chính xác của phươngpháp được đề xuất trong bộ xác thực đạt 96,22% trên SVM và 95,91% trên RF

2.1.3 Các công trình nghiên cứu theo hướng các mô hình CNN và một số mô

hình khác

Cuối cùng là các mô hình kiến trúc mạng nơ-ron tích chập, đây là một loại

mạng nơ-ron sử dung trong deep learning dé xử lý và phân tích dữ liệu hình ảnh Các

tầng tích chập trong CNN cho phép mô hình học được các đặc trưng cục bộ của hình

ảnh, giúp tăng độ chính xác trong quá trình nhận diện đối tượng Vì vậy, CNN được

sử dụng rộng rãi trong các bài toán nhận diện đối tượng trong hình ảnh và cũng được

ap dụng như trong bài bao "Deep convolutional neural network based detectionsystem for real-time corn plant disease recognition" [19], tac giả đã đề xuất một mô

hình CNN được chỉnh sửa dé huấn luyện và triển khai trên thiết bị có tên là Intel

15

Trang 25

Movidius Neural Compute Stick, hỗ trợ framework TensorFlow, dựa trên mạng

neural tích chập Mô hình học sâu đạt được độ chính xác 88,46% trong quá trình nhậndiện các bệnh của lá ngô Mô hình này được tối ưu hóa để phù hợp với việc đưa rakết quả theo thời gian thực và có thể chạy trên các thiết bị thông minh độc lập nhưRaspberry Pi, điện thoại thông minh và các drone trên tập dữ liệu 679 hình anh trong

bộ dữ liệu Trong bai báo "Maize leaf disease classification using deep convolutional

neural networks" [20], tac gia dé xuất một kiến trúc mạng nơ-ron tích chập sâu (CNN)dựa trên LeNet được chỉnh sửa dé phân loại bệnh lá ngô Mô hình được huấn luyệnbăng cách sử dụng các hình ảnh từ bộ dữ liệu PlantVillage và có khả năng xác địnhbốn nhãn khác nhau (ba nhãn bệnh và một nhãn khỏe mạnh) Mô hình đạt được độ

chính xác là 97,89% Thực nghiệm được thực hiện trên tổng cộng 4365 hình ảnh với

kích thước 256 x 256 điềm ảnh Các tác giả đã xem xét việc nghiên cứu nhận diện

đối tượng dé xác định các loại bệnh trên lá ngô khác nhau bằng mô hình GoogLeNet

như trong bài "Identification of Maize Leaf Diseases Using Improved Deep

Convolutional Neural Networks" [21] Mô hình được huấn luyện băng cách sử dung

3060 hình anh với các bệnh lá dom xám, đốm nâu, đốm lá curvularia, virus mosaiclùn, đốm lá màu xám, đốm tròn và bệnh cháy lá được thu thập từ các nguồn khácnhau, chang hạn như Plant Village và trang web của Google Độ chính xác kiểm tratop-1 là 98,8%, 98,6%, 98,2%; độ chính xác kiểm tra top-5 là 99,6%, 99,6%, 99,6%.Tác giả đề xuất sử dụng trong nghiên cứu sử dụng mạng nơ-ron tích chập (CNN)

trong bài báo "Detection of disease on corn plants using Convolutional Neural

Network methods" [22] dé chân đoán các bệnh trên cây ngô Mô hình dựa trên một

bộ dir liệu được sử dụng trong nghiên cứu này là một phần của bộ dt liệu PlantVillagevới 3.854 hình ảnh của ba loại bệnh ngô: bệnh cháy lá, đốm lá màu xám va phấn đen

Độ chính xác của mô hình trong việc phát hiện bệnh trên cây ngô là 99% Mang ron tích chập (CNN) và OpenMP được tác giả trong bài báo "Detection of Corn Leaf

nơ-Diseases using Convolutional Neural Network with OpenMP Implementation" [23]

dé xuất sử dụng dé phát hiện bệnh trên lá ngô Mục tiêu của nghiên cứu là xác định

và phân loại loại bệnh hiện diện trên lá thông qua bộ phân loại của kiến trúc mạng

16

Trang 26

CNN Mô hình dựa trên một bộ dữ liệu sử dụng trong nghiên cứu nay là một phần

của bộ dir liệu PlantVillage với 3.854 hình ảnh của ba loại bệnh ngô: bệnh cháy lá,bệnh đốm lá màu xám phan den D6 chinh xac cua hé thống trong việc phát hiện bệnhcháy lá, bệnh đốm lá màu xám phan đen lần lượt là 93%, 89% và 89% Mạng nơ-ron

tích chap (CNN) cũng được tác gia trong bài báo "A Computational Procedure for theRecognition and Classification of Maize Leaf Diseases Out of Healthy" [24] dùng dénhận dang và phân loại các bệnh lá ngô Kiến trúc được đề xuất bao gồm một bộ phân

loại được kết nối đầy đủ cho CNN Mô hình được huấn luyện băng cách sử dụng

Neuroph Các hình ảnh được sử dụng cho huấn luyện và kiểm tra được chụp băngmáy ảnh smartphone Google Pixel 3 trong một cánh đồng ngô và được lưu trữ trong

một tập tin trên Google Drive cho 54.306 hình anh với ba loại bệnh lá ngô khác nhau(bệnh phan đen, cháy lá và dém lá màu xám) ngoài lá khỏe mạnh, độ chính xác của

mô hình là 87% Tác giả trong bài báo "Impact of dataset size and variety on the

effectiveness of deep learning and transfer learning for plant disease classification"

[25] đã thử nghiệm tac động lên kích thước va sự da dạng cua tap đữ liệu dé kiểm tra

xem mức độ ảnh hưởng hiệu quả của các kỹ thuật học sâu cho việc nhận dạng bệnhthực vật Kiến trúc được đề xuất dựa trên các mạng nơ-ron tích chập (CNN) Mô hình

đã được huấn luyện bằng cách sử dụng một bộ dữ liệu hình ảnh gồm 165 hình ảnhcủa các triệu chứng được biểu hiện trên các lá Tập dữ liệu được sử dụng trong nghiêncứu nay tương tự như tập dữ liệu được sử dụng trong nghiên cứu của Barbedo (2016).

Cũng như bai báo trên thi tác giả của "A CNN Approach for Corn Leaves DiseaseDetection to support Digital Agricultural System" [26] đề xuất một mô hình CNN cảitiễn dé phát hiện các bệnh lá ngô Mô hình được huấn luyện va kiểm tra trên bốn loạihình ảnh lá ngô, bao gồm ba loại bệnh và một loại khỏe mạnh, đạt độ chính xác phát

hiện trung bình là 98,78% cho ba loại bệnh lá ngô Bộ dữ liệu được sử dụng cho

nghiên cứu này chứa 3.823 hình ảnh lá ngô, được thu thập từ Plant Village Kiến trúc

Efficient Attention Network (EANet) thuộc mạng nơ-ron tích chập (CNN) trong bai

"Efficient attention-based CNN network (EANet) for multi-class maize crop disease

classification" [27] được tac gia nghiên cứu dựa trên mô hình EfficientNetv2 dé nhận

17

Trang 27

dạng các bệnh trên cây ngô Phương pháp đề xuất được đánh giá trên các tập dữ liệu

có sẵn có mẫu được chụp dưới các điều kiện môi trường khác nhau như nền khác

nhau, ánh sáng không đồng đều và sự biến đổi về màu sắc Mô hình cho thấy độ chínhxác tông thé là 99,89% cho việc phân loại các bệnh trên nhiều nhãn của cây ngô Các

bộ dir liệu được sử dụng trong nghiên cứu nay là tập dữ liệu bệnh ngô từ cơ sở dữliệu PlantVillage và PlantDoc, chứa tổng cộng 4.188 mẫu với ba loại bệnh lá ngô:bệnh cháy lá, đốm lá màu xám (GLS), bệnh đóm đen (NLB), và lá ngô khỏe mạnh

Kiến trúc được đề xuất dựa trên mô hình MobileNetV2 được tác giả sử dụng trong

bai báo "Identifying plant diseases using deep transfer learning and enhanced

lightweight network" [28] đề xuất một phương pháp dé phát hiện các bệnh thực vậtbăng cách sử dụng mạng nơ-ron tích chập (CNNs) và học chuyền giao nhưng đượcsửa đôi dé tăng khả năng học tập của các chi tiết bệnh nhỏ nhất có trên cây trồng.Phương pháp đề xuất đạt độ chính xác trung bình là 99,85% trên bộ dữ liệuPlantVillage, bao gồm 54.306 hình ảnh lá cây với 26 loại bệnh và 12 loài cây khỏe

mạnh cho 14 loại cây trồng 38 bộ dữ liệu hình ảnh được tải xuống từ cơ sở dữ liệu

Plantvillage, bao gồm táo, khoai tây, nho, cà chua và ngô, v.v Kiến trúc

MobileNetV2 được tác giả trong bài báo "Maize leaf disease identification using deeptransfer convolutional neural networks" [29] nghiên cứu và đề xuất dùng dé sử dụngnhận dạng các bệnh trên cây ngô Kiến trúc này dựa trên một loại mạng nơ-ron tích

chập (CNN) Mô hình được thiết kế dé được sử dụng trên cả máy tram và thiết bị diđộng Nó có độ chính xác 99,11% và có thé nhận dạng đối tượng trong hình ảnh

nhanh chóng Tổng cộng 1189 hình ảnh số của cây ngô được thu thập và kiểm tra trên

một máy trạm Bài báo "Classification of Corn Diseases from Leaf Images Using

Deep Transfer Learning" [30] được tác giả nghiên cứu nhắm đến ứng dung của việctái sử dụng mô hình đã huấn luyện từ trước trong việc phân loại ba loại bệnh ngôcùng với cây ngô khỏe mạnh bằng mười mô hình mang neural tích chập sâu Ngoài

ra, các thử nghiệm được lặp lại 10 lần dé kiểm tra tính biến đổi trong việc chọn lựa

ngẫu nhiên Giá trị độ chính xác tương ứng là 98,6% với 3852 hình ảnh lá ngô được

chia thành bốn loại Kết qua cho thấy việc các mô hình có thé chạy được thiết bị di

18

Trang 28

động Bài báo "Y-Net: Identification of Typical Diseases of Corn Leaves Using a

3D-2D Hybrid CNN Model Combined with a Hyperspectral Image Band Selection

Module" [31] dựa trên dữ liệu hình ảnh siêu phd, két hợp lựa chon băng tần, cơ chế

self-attention, trích xuất đặc trưng không gian - phô và phân loại vào một quá trìnhtối ưu hóa thống nhất Y-Net đạt được độ chính xác phân loại tốt nhất so với máyvector hỗ trợ, mang CNN một chiều (1D) và mang CNN hai chiều (2D) Sau khi đãloại bỏ những phần không cần thiết của Y-Net, kích thước mô hình đã giảm xuốngmột phan ba so với kích thước ban đầu, và độ chính xác đạt 98,34% với tổng số 6.264mẫu bệnh được thu thập Nghiên cứu này thực hiện việc nhận dạng lá ngô bằng hệ

thống HSI được sản xuất bởi Head Wall, Hoa Kỳ Hệ thống bao gồm một máy ảnh

siêu phổ, nguồn sáng (đèn halogen có thê điều chỉnh công suất 150 W), bàn di động,hộp nguồn sáng, bộ thu thập và máy tính Nghiên cứu trong bài báo "A Computational

Procedure for the Recognition and Classification of Maize Leaf Diseases Out of

Healthy Leaves Using Convolutional Neural Networks" [24] str dung nguyén ly cua

mang no-ron tich chap (CNN) dé xây dựng một mang đề nhận dạng và phân loại hìnhảnh các bệnh lá ngô được thu thập bằng sử dụng máy ảnh điện thoại thông minh Độchính xác tông thé của CNN là 92,85% với 54.306 hình ảnh của lá cây bị bệnh (bệnh

lá đen, bệnh cháy lá, bệnh dém lá xám) và lá cây khỏe mạnh Các tác giả đã đề xuấtmột phương pháp cho việc phát hiện sớm và chân đoán bệnh trong một số loại cây

theo mùa bang cach su dung kiến trúc hoc sâu, đặc biệt là mạng nơ-ron tích chập

(CNN) như trong bài báo "Classification and Identification of Primitive Kharif Cropsusing Supervised Deep Convolutional Networks" [32] Các mô hình được huấn luyện

dé phát hiện bệnh từ các loại cây theo mùa bị nhiễm bệnh Nghiên cứu sử dung một

cơ sở dữ liệu gồm 600 hình ảnh, bao gồm 200 hình ảnh của các loại cây theo mùa

khác nhau được gắn nhãn với 10 loại bệnh cây trồng Độ chính xác tối đa đạt được là

93,7% băng cách sử dụng kích thước nhóm trung bình với kích thước bộ lọc tích chập

là 64 * 64 * 3 Nghiên cứu so sánh tính khả thi, độ chính xác và hiệu suất của mạngđược đề xuất với các kỹ thuật trích xuất đặc trưng thông thường như support vectormachine, k-nearest neighbor, giải thuật di truyền và mạng neural nhân tạo Tác giả

19

Trang 29

nghiên cứu đã đề xuất một kiến trúc mới dựa trên mạng nơ-ron tích chập dày đặc tối

ưu được gọi là DenseNet trên cây ngô có trong bài báo "An Optimized Dense

Convolutional Neural Network Model for Disease Recognition and Classification in

Corn Leaf" [33] Mô hình DenseNet được dé xuất da dat được độ chính xác là 98,06%

với tong cộng 12332 hình ảnh kích thước 250 x 250 pixel được thu thập thủ công từ

các nguồn khác nhau, được chia thành 4 nhãn cây trồng gồm: bệnh cháy lá, bệnh đốm

lã xám và bệnh lá đen và cây khoẻ mạnh Với mục đích phát hiện bệnh và sâu bệnh

trên cây trồng với độ chính xác cao, tác giả trong bài báo "Identification of Diseases

in Corn Leaves using Convolutional Neural Networks and Boosting" [34] sử dụng kỹ

thuật mang no-ron tích chập (CNN) và kỹ thuật boosting trên hình anh lá ngô trong

các trạng thái khác nhau về sức khỏe Sử dụng một tập hợp các bước tăng cường thích

nghi, tác giả đã đạt được độ chính xác là 98% trong việc phân loại 2000 hình ảnh từ

bộ dữ liệu PlantVillage thành bốn loại khác nhau: khỏe mạnh, bệnh cháy lá, bệnh đen

lá và bệnh đốm lá Đây là một cải thiện khoảng 8% về hiệu suất phân loại so với chỉ

sử dung CNN Các tác giả sử dụng đã đề xuất một kiến trúc mạng no-ron

DMS-Robust Alexnet mới có trong bài báo "Maize Leaf Disease Identification Based on

Feature Enhancement and DMS-Robust Alexnet" [35] dé nhận dang các bệnh trên lángô Mô hình này dựa trên kiến trúc cốt lõi Alexnet và kết hợp tích chập co giãn vàtích chập đa tầng để cải thiện việc trích xuất đặc trưng Phương pháp được dé xuấtcho thấy tính ôn định mạnh mẽ đối với các hình ảnh bệnh lá ngô được thu thập trong

môi trường tự nhiên Độ chính xác đạt 98,62% với tổng cộng 7193 hình ảnh Cuối

cùng sẽ là một số bài báo sử dụng định dạng RGB và các đặc trưng xử lý hình ảnhkhác dé phát hiện màu sắc Cụ thé, trong bài báo "Crop conditional Convolutional

Neural Networks for massive multi-crop plant disease classification over cell phone

acquired images taken on real field conditions" [36], tac giả sử dụng mang no-ron

tích chập (CNN) dé phân loại bệnh trên cây trồng Cac mô hình được huấn luyện trênmột tập dữ liệu hơn một trăm nghìn hình ảnh chụp bằng điện thoại di động trong điều

kiện thực tế trên cánh đồng Tập dữ liệu chứa các giai đoạn bệnh gần như băng nhau

của mười bảy bệnh và năm loại cây trông (lúa mì, lúa mạch, ngô, gạo va hat cai) trong

20

Trang 30

đó một số bệnh có thê xuất hiện trên cùng một hình ảnh Các mô hình đã được thửnghiệm cho cả nhiệm vụ phân loại đa cây trồng và phân loại riêng cho từng loại câytrồng Mạng phân loại bệnh trên cây trồng có điều kiện dựa trên thông tin ngữ cảnhbang cách nối chuỗi tại cấp vector nhúng đạt được độ chính xác cân bang là 0.98, cảithiện tất cả các phương pháp trước đó và loại bỏ 71% số lần phân loại sai của cácphương pháp trước đó Các mô hình đề xuất có thể được sử dụng cho cả máy trạm và

di động Tập dữ liệu được sử dụng dé xác nhận phương pháp đề xuất ở định dạngRGB va được thay đổi kích thước thành 224x224 với tong cộng 631 hình ảnh Trongnghiên cứu khoa học các tác giả đã đề xuất mô hình được điều chỉnh tinh chỉnh dựa

trên transfer learning EfficientNet trong bài báo "EfficientNet based recognition of

maize diseases by leaf image classification" [37] dé nhận dang va phân loại các bệnhtrên lá ngô Kiến trúc được đề xuất được tăng cường dữ liệu, học từ một mô hìnhEfficientNet được huấn luyện trước và thay thế lớp cuối cùng bằng một bộ phân loạisoftmax 8 lớp Mô hình đề xuất đã cho thay sự cải thiện đáng ké về tốc độ huấn luyện

và độ chính xác nhận dạng so với các mạng khác như VGG-16, Inception-v3 và

Resnet-50, với độ chính xác tối đa là 98,52% Mô hình có thé triển khai trên các thiết

bị di động dé chân đoán và điều trị các bệnh trên lá ngô, giúp giảm thiểu các tốn thất

do bệnh tật gây ra Tên tập dữ liệu đã được sử dụng đề xác nhận phương pháp đề xuất

ở định dang RGB và được thay đôi kích thước thành 224x224 với tổng cộng 9.272hình ảnh Ở một nghiên cứu khoa học khác, tác giả trong bài báo "Automatic

identification of diseases in grains crops through computational approaches: A

review" [38] dé xuất các kiến trúc va mô hình được sử dụng cho việc phát hiện vàphân loại bệnh trên cây, bao gồm tiền xử lý hình ảnh, phân đoạn, trích xuất đặc trưng,lựa chọn đặc trưng và phương pháp phân loại Bài báo sử dụng nhiều mô hình khác

nhau cho việc phát hiện và phân loại bệnh trên cây trồng, bao gồm: Artificial Neural

Networks (ANN), Support Vector Machines (SVM), Decision Trees (DT) ,Random

Forest (RF), K-Nearest Neighbors (KNN), Convolutional Neural Networks (CNN).

Độ chính xác của các phương pháp tính toán được đánh giá dao động từ 70% đến99% Tap dit liệu Plant Village được sử dụng dé xác nhận phương pháp đề xuất ở

21

Trang 31

định dạng RGB và được thay đổi kích thước thành 256x256 với tong cộng 3.852 hìnhảnh Ngoài ra ở phần này, chúng tôi giới thiệu một số mô hình khác: Resnet,

YOLOv4, DFCANet, vv Ví dụ ở bài báo "An optimized DenseNet model for corn

leaf disease recognition and classification" [33] dé xuất một mô hình DenseNet được

tối ưu hóa dé nhận dạng và phân loại các bệnh trên lá ngô Mô hình dựa trên kiến trúcmạng nơ-ron tích chập dense Mô hình dé xuất đạt được độ chính xác là 98,06% Tập

dữ liệu được sử dụng trong nghiên cứu bao gồm 12.332 hình ảnh với kích thước 250

x 250 pixel Tác giả đã đề xuất sử dụng thị giác máy tính và học sâu trong bài báo

"Plant Leaf Detection and Disease Recognition using Deep Learning" [39] dé phát

hiện và chan đoán bệnh trên cây trồng Kiến trúc đề xuất bao gồm một bộ dữ liệu đầu

vào, thu thập hình ảnh, tiền xử lý hình ảnh và phân loại hình ảnh Hệ thống dựa trên

các mô hình học sâu được huấn luyện dé nhận dạng các biến thể cây trồng và bệnhtật khác nhau và có thể được sử dụng trên cả máy tính và thiết bị đi động Mô hìnhđược huấn luyện bằng khoảng 35.000 hình anh từ kho dữ liệu Plant Village, với 32

nhãn khác nhau của biến thé cây trồng và bệnh tật với bốn nhãn khác nhau trong bệnh

của cây ngô như cháy lá, đốm lá xám, bệnh dom den và khỏe mạnh Mô hình đạt được

tỷ lệ độ chính xác 96,5% trong quá trình huấn luyện và đạt độ chính xác tối đa 100%

khi thử nghiệm trên các hình ảnh ngẫu nhiên của các cây trồng có bệnh Bài báo

"Real-time System For Identifying Crop Diseases Based on Leaf Images using

Machine Learning" [40] được các tac giả đề xuất một kiến trúc mạng nơ-ron tích chập

sâu cho phân loại bệnh trên cây và một cơ chế phát hiện đơn giản cho xác định và vị

trí các đóm lá Hệ thống được triển khai trên phần cứng nhúng Nvidia Jetson TX1 dé

phát hiện và nhận dạng bệnh trên cây thời gian thực trong lĩnh vực nông nghiệp Độ

chính xác phân loại bệnh đạt khoảng 96,88%, và các mô hình được huấn luyện trên

hình ảnh từ tập dữ liệu PlantVillage với 7.704 hình ảnh Trong khi đó, tác giả trong

bài báo "End-to-End Deep Learning Model for Corn Leaf Disease Classification"

[41] đề xuất một mô hình deep learning end-to-end dé nhận dang lá cây trồng khỏemạnh và bị bệnh Kiến trúc được đề xuất sử dụng hai mạng neural tích chập được tiềnhuấn luyện, EfficientNetB0 và DenseNet121 Mô hình có thể đạt được độ chính xác

22

Trang 32

phân loại là 98,56% và được so sánh với các mô hình nơ-ron tích chập được tiền huấn

luyện khác, đặc biệt là ResNet152 và InceptionV3 Tập dữ liệu được sử dụng trong

thử nghiệm là một phần con của tap dữ liệu PlantVillage được lưu trữ trên Kaggle vabao gồm khoảng 217.000 hình ảnh bao gồm 38 loại khác nhau của cả hình ảnh cây

khỏe mạnh và bị bệnh Tuy nhiên, bài báo có tiêu đề "ResNet - Deep Neural Network

architecture for leaf disease classification" [42] đề xuất việc sử dụng kiến trúc ResNetdựa trên học sâu dé nhận dạng bệnh trên cây trồng Mô hình sử dụng mạng nơ-rontích chập (CNN) và được thiết kế chạy trên thiết bị di động Nghiên cứu sử dụng một

tập dữ liệu được gọi là Plantvillage, chứa 54.306 hình ảnh của các loại bệnh khácnhau, và trích xuất các hình ảnh bệnh cho cả chua, khoai tây, ngô với 3.852 hình ảnh,

cà tím và ớt Tổng cộng 30.085 hình ảnh được sử dụng trong nghiên cứu với độ chínhxác của ResNet là 96,6% Ở bài báo "Identification of maize leaf diseases by usingthe SKPSNet-50 convolutional neural network model" [43] đề xuất một mô hìnhmang no-ron tich chap duoc goi la SKPSNet-50 dé nhan dang chính xác các bệnhtrên lá ngô Mô hình dựa trên mạng nơ-ron ResNet-50 nhưng đã thay thế lõi tích chập3x3 bằng một khối xây dựng được cải tiến gọi là Select Kernel-Point-Swish-B(SKPS) và sử dụng hàm kích hoạt Swish-B đề cải thiện việc trích xuất đặc trưng Môhình vượt trội hơn so với các mô hình học máy cô điện và các mô hình mạng nơ-ronsâu khác, đạt được độ chính xác trung bình của quá trình nhận dạng là 92,9% Tổngcộng 1452 ảnh được sử dụng trong quá trình huấn luyện Kiến trúc hệ thống dựa trên

mạng heavy-weight nơ-ron tích chập với tăng cường dữ liệu kết hợp cùng học chuyên

giao và điều chỉnh siêu tham số để phân loại trong bài báo "Corn Leaf Disease

Classification and Detection using Deep Convolutional Neural Network" [44] đã

được các tác giả nghiên cứu dùng dé xác định bệnh trên lá ngô Mô hình sử dụng khối

VGG cho phân loại bệnh và YOLOv4 cho định vị bệnh Hệ thống đề xuất có thê được

sử dụng trên cả máy tính đồng bộ và di động Tập dữ liệu được sử dụng cho các thử

nghiệm có tên là “corn leaf diseases” Nghiên cứu đạt được độ chính xác phân loạibệnh là 99,25% và độ chính xác trung bình truy xuất (mAP) của bệnh là 55,30% các

mô hình CNN truyền thống có độ chính xác thấp và số lượng tham số lớn Ngược lại,

23

Trang 33

bài báo "DFCANet: A Novel Lightweight Convolutional Neural Network Model for

Corn Disease Identification" [45] các tác giả đề xuất một mô hình light-weight nhận

dạng bệnh trên lá ngô gọi là DFCANet (Double Fusion block with Coordinate

Attention Network) Kết qua cho thay rằng DFCANet có độ chính xác trung bình là

98,47% với 3271 hình ảnh trong tập dữ liệu PlantDoc được chia thành 6 nhãn câytrồng Các tác giả đề xuất kỹ thuật hoc sâu dé phát hiện bệnh trên cây trồng trong bài

báo "Plant Disease Detection using Deep Transfer Learning" [46] sử dung mô hình

VGGNet-19 đã được huấn luyện trước bằng trọng số của tập dữ liệu "ImageNet" Mô

hình được kiểm tra trên ngô với 3.852 hình ảnh trên Plantvillage, đạt độ chính xác

99,52% sau khi chạy trong 20 epochs.

2.2 Các kỹ thuật liên quan

2.2.1 NodeJS

Theo thông tin ở trang chủ của nhà phát hành NodeJS [47] thì NodeJS là mộtchương trình được viết bằng ngôn ngữ Javascript nhưng được chạy theo thời gianthực dựa trên phương thức bất đồng với nhau và được xây dựng trên nền tang phốbiến như: V8 JavaScript runtime của trình duyệt Chrome, libUV, wv Điều đặc biệt ởđây về Node.js là nó cho phép sử dụng JavaScript dé phát trién các ứng dung backend,

API, các ứng dụng web và các ứng dụng mạng khác Ryan Dahl là người sáng lập vaphát triển Node.js Phiên bản đầu tiên của Node.js được ra mắt vào năm 2009 và kế

từ đó đã được cộng đồng phát triển và nâng cấp liên tục Node.js cũng được hỗ trợbởi nhiều công cụ, thư viện và framework phô biến như Express.Js, Socket.1o, Meteor,

NestJS và nhiều hơn nữa, giúp cho các nhà phát triển có thé phát triển các ứng dụng

mạng một cách nhanh chóng và hiệu quả trên nhiều nền tảng khác nhau

NodeJS có rất nhiều ưu điểm dé hỗ trợ cho việc lập trình back-end dễ dànghon một trong những ưu điểm phải kế đến đó là:

- Xử lý bất đồng bộ: được thiết kế dé xử lý các tác vu I/O không đồng bộ và

các sự kiện trong hệ thong, đảm bảo hiệu suât cao và tiệt kiệm tài nguyên.

24

Trang 34

- Khả năng mở rộng: Node.js có khả năng mở rộng dé dàng theo chiều ngang

(horizontal scaling) và chiều dọc (vertical scaling), cho phép xử lý hàng

ngàn kết nối đồng thời một cách hiệu quả

- Sử dụng ngôn ngữ Javascript: đây là một ngôn ngữ phô biến, điều đó giúp

cho các nhà phát triển và lập trình viên dễ tiếp cận bởi vì đó là một ngônngữ phô biến

Server- Wireless Real-time

side proxy connectivity data Chat Bots REST API

ebsSe0e%

Data Big-data and System Monitoring Queued I/O Web scraping Streaming Analytics dashboard Inputs and automation

Hình 2.1 Ung dung của NodeJS

Sử dung NodeJS dé xây dựng các API cho những việc liên quan như tra tập

dữ liệu dữ liệu, xử lí và nhận thông tin từ người dùng từ ứng dụng di động theo thời

gian thực thông qua một số phương thức (POST, GET, PUT, DELETE) một cáchnhanh chóng NodeJS cũng giúp cho việc phát triển ứng dụng di động trở nên linhhoạt và đễ dàng hơn, nhờ vào khả năng xử lý các yêu cầu tương tác đồng thời theo

thời gian thực của nó.

2.2.2 MongoDB

MongoDB [48] là một hệ thống quản ly cơ sở dir liệu phi quan hệ (NoSQL)được viết bằng C++ mục đích là dùng dé lưu trữ và xử lý dữ liệu tài liệu (document-

based data) trong các ứng dụng web và mobile MongoDB lưu trữ dir liệu dưới dạng

tài liệu JSON (BSON - Binary JSON), cho phép các nhà phát triển lưu trữ và truy

xuất đữ liệu một cách linh hoạt, nhanh chóng và thuận tiện

MongoDB là một sản phẩm mã nguồn mở được phát triển bởi MongoDB, Inc

và cộng đồng dùng và đóng góp cho NoSQL MongoDB hỗ trợ nhiều ngôn ngữ lập

25

Trang 35

trình như Java, Python, Node.js, Ruby, PHP và nhiều ngôn ngữ khác, giúp cho cácnhà phát triển có thé sử dụng một ngôn ngữ lập trình yêu thích dé truy xuất và xử lý

dir liệu trong MongoDB.

MongoDB có rất nhiều ưu điểm dé hỗ trợ cho việc lưu trữ cơ sở dữ liệu dédàng hơn những ưu điểm được liệt kê là:

- Hiệu suất truy van cao: nhờ vào sử dụng mô hình tài liệu cùng với việc sắp

xếp các thông tin liên quan vào bên trong duy nhất một tài liệu nên các câutruy vấn trả về tất cả thông tin cần thiết trong một cuộc gọi duy nhất đến

cơ sở dữ liệu thay vì sử dụng phép nối như trong các cơ sở đữ liệu thông

thường.

- Cài đặt đơn giản: Sử dụng MongoDB Atlas dé thiết lập và cài đặt các cụm

MongoDB dễ dàng hơn bao giờ hết

- Tiết kiệm chi phí: MongoDB có nhiều gói dành cho cá nhân hoặc doanh

nghiệp nên có thể lựa chọn được gói phù hợp với mục đích sử dụng củaứng dụng giúp tiết kiệm chỉ và tăng tính hiệu quả khi sử dụng

MetadataConfig | =

Sử dụng MongoDB để lưu trữ thông tin người dùng, thông tin về cây trồng và

các dữ liệu cần thiết dé có thể hiển thị đầy đủ trên ứng dung di động

26

Trang 36

2.2.3 Pytorch

PyTorch [49] là một thư viện mã nguồn mở tensor tối ưu hóa cho học sâu sử

dụng GPU và CPU Được xây dựng bở Facebook AI Research PyTorch thiết kế để

dễ sử dụng và có tính linh hoạt cao, cho phép người dùng tùy chỉnh các phần của mô

hình học sâu một cách dé dàng PyTorch cũng hỗ trợ nhiều các thư viện khác nhautrong học sâu, bao gồm các thư viện cho việc xử ly dit liệu, tao mô hình, tối ưu hóa

và đánh giá mô hình cho phép người dùng xây dựng các mô hình có cấu trúc phứctạp hơn, sử dụng các điều kiện và vòng lặp, và thực hiện các phép tính động trong

quá trình huấn luyện

Pytorch có rất nhiều ưu điểm sử dụng dé huấn luyện va tối ưu mô hình học

máy như:

- _ Tối ưu hóa GPU: PyTorch hỗ trợ tính toán trên GPU, cho phép tăng tốc

độ tính toán và giảm thời gian huấn luyện mô hình

- Thu viện mạnh mẽ: PyTorch cung cấp một loạt các tính năng mạnh mẽ

cho xử lý dữ liệu, tạo mô hình, tối ưu hóa và đánh giá mô hình

- Dễ sử dụng: PyTorch được thiết kế dé đơn giản va dé sử dụng, cho phép

người dùng tập trung vào việc xây dựng và huấn luyện mô hình hơn là

cài đặt các tính năng cơ bản.

Hình 2.3 Các tính năng và ứng dụng của Pytorch

Nhóm chúng tôi sử dụng Pytorch dé huấn luyện và khảo sát các mô hình kiếntrúc Transformer và triển khai các mô hình lên ứng dụng di động

27

Trang 37

Chương 3 PHAN TÍCH VÀ THIET KE HE THONG

3.1 Tong quan về hệ thống

Ở phan này, nhóm nghiên cứu của chúng tôi đã phát trién một cơ chế mới dé

xác định lá cây bị bệnh bằng kiến trúc Transformer Bằng cách triển khai mô hình

này trên các thiết bị phần cứng có tài nguyên hạn chế, chúng tôi có thể phát hiện lá

cây bị nhiễm bệnh sớm được minh họa trong Hình 3.1 Phương pháp này cho phép

mô hình hoạt động hiệu quả ngay cả trên các thiết bị có sức mạnh vi xử lý thấp, làmcho việc triển khai và sử dụng trên nhiều nền tang dé dàng hơn Bang cách xác địnhcác van đề bệnh dịch một cách kip thời, công cụ nay có thể giúp ngăn chặn sự lây lan

của bệnh dịch và hỗ trợ quản lý hiệu quả sức khỏe cây Trong hệ thống này, các thiết

bị di động được sử dụng đề đánh giá tình trạng sức khỏe của cây trồng thông qua việc

phát hiện bệnh trên lá cây băng sự kết hợp của các hệ thống như: tải và lưu trữ cáctập dữ liệu trên đám mây, gọi API đề nhận dữ liệu từ dữ liệu lưu trữ đám mây thông

qua API, nhận tập dữ liệu từ cơ sở đám mây, tải mô hình và lưu trữ lên VPS Vultr

thông qua API, nhận mô hình từ VPS Vultr và thông tin từ MongoDB thông qua API,

tải thông tin kết quả lên cơ sở đữ liệu MongoDB thông qua API theo trình tự đượcđánh số và mô tả trong hình ảnh bên dưới với các bước sau đây:

- _ Xây dựng tập dữ liệu: Đầu tiên ở dé tạo ra một bộ dit liệu toàn diện cho việc

xác định bệnh trên cây trồng, nhóm đã thu thập hình ảnh từ nhiều nguồn khác

nhau, bao gồm Google Scholar, Kaggle, Mendeley Data và RepositórioDigipathos Số lượng ước tính của bộ dữ liệu hơn 30 tập đữ liệu với kích thước

tong cộng hơn 100 GB Sau đó, đối với mỗi tập dữ liệu chúng tôi phân loại từnghình ảnh theo loại bệnh cây trồng va gan nhãn chúng với một tệp "train.csv" bên

trong chứa hai cột ("image_id" và "label"), một tệp JSON chứa thông tin nhãn vamột thư mục có tên "train_images" dé lưu trữ các tệp hình ảnh và các tập dữ liệu

sau khi đã xử lí xong sẽ được tải lên và lưu trữ trên máy chủ LongVan SSD (1).

- _ Nền tảng đám mây lưu trữ va cơ sở dữ liệu: Nhóm chúng tôi sử dung VPS

Vultr để lưu trữ mô hình và API, thông tin về cây và thông tin người dùng truy

28

Trang 38

xuất trên ứng dụng đi động sẽ được gọi qua các API trên Vultr, các thông tin đó

được lưu trên cơ sở dit liệu MongoDB LongVan SSD Cloud được dùng để lưu

các tập dữ liệu Các hàm API được xây dựng với các framework web ExpressJS

và NodeJS trên ngôn ngữ lập trình JavaScript.

Google Colab: Chúng tôi sử dụng Google Colab đề huấn luyện các mô hình giúptiết kiệm thời gian trong quá trình nghiên cứu và sử dụng các bộ dữ liệu từ máychủ Long Vân (2), (3) trên nền tảng đám mây mà chúng tôi đã thu thập và xây

dựng trước đó dé đảm bảo tính nhất quán và khả năng so sánh mô hình theo các

tiêu chí của chúng tôi bao gồm: độ chính xác, mat mát và số khung hình mỗi giây(FPS) khi hoạt động trên máy tính Các lần thử nghiệm này làm nỗi bật những

mô hình cho hiệu suất tốt Sau đó, chúng tôi sẽ chuyển đôi những mô hình này

dé giúp chúng có thê chạy trên các thiết bị cận biên va song song đó tải các môhình này lên nền tảng đám mây ở đây chúng tôi lưu trữ vào máy chủ VPS Vultr(4) thông qua các API xây dựng trước đó nhằm giúp các thiết bị cận biên có thé

tải xuống một cách đễ dàng nhanh chóng

Thiết bị cận biên: Hệ thống tải các mô hình từ đám mây (5) đã được huấn luyện

từ Google Colab trước đó vào ứng dụng Sau đó ứng dụng sẽ sử dụng camera trênthiết bị di động đề chụp hình ảnh các lá cây, bao gồm vị trí của bất kỳ vết đánhdau nào trên mỗi lá Tiếp theo, các hình anh này được phân tích và phân loại bằngcác mô hình học sâu được gọi là Lightweight VIT, các mô hình đã được huấn

luyện và thiết kế đặc biệt dé triển khai trên các thiết bị di động Kết quả sau khi

xử lí về bệnh mà mô hình đã phát hiện được hiển thị trên ứng dụng cho ngườidùng (6) Bằng cách cung cấp thông tin kịp thời và chính xác về bệnh trên câytrồng, hệ thống của chúng tôi có thé giúp ngăn ngừa các mat mát nghiêm trọng

và thậm chí là that bại về mùa màng Điều này giúp tiết kiệm chi phí đáng ké chonông dân, đồng thời cải thiện sức khỏe và năng suất tổng thể của cây trồng của

họ Các nghiên cứu của chúng tôi hỗ trợ mạnh mẽ cho các giải pháp phát hiện và

quản lý bệnh trên cây trồng trong nông nghiệp một cách bền vững và hiệu quả

hơn.

29

Trang 39

(2) (/ (4) Tải mô hình lên VPS Valt

thông qua API

`,

‘Goi API đề nhận dữ liệu từ dữ liệu N 4

lưu tr đâm mây thông qua API ` ø

a “số a

2s A (asa—

ys Tiền xử li dữ liệu “Tập di liệu hình ảnh (1) —— —

Thu thập dữ liệu hình ảnh về các bệnh trên lá cây "MongoDB tử nhiễu nguồn khác Tải lên và lưu trừ.

led trên đâm mây a : \

Máy chú SSD Long Vân \ API + VPS Vultr

Tap dữ liệu online

Backend

fy `

JS) ~

/ Nhậu mô hình từ VPS Vultr và thông.

Z tin từ MongoDB thông qua API

(6) Tài thông tin kết quả lên

Ñ cơ sử dữ liệu MongoDB

NỀN _ thong qua APT

Ứng dung nhận dạng Phát hiện bệnh Phân tích

bệnh trên cây trồng tiên cây

Khoé mạnh

)

'Thiết bị cận biên Ret qua

Hình 3.1 Mô hình hệ thống phát hiện bệnh trên thiết bi di động

3.2 Mô hình học sâu

Trong phan này, chúng sẽ di sâu vào nghiên cứu và thử nghiệm 5 mô hình họcsâu dựa trên kiến trúc Transformer với các thông số được mô tả như bảng 3.1 dưới

đây

Bảng 3.1 Bảng mô tả thông số của các mô hình học sâu

Tên mô hình Kích thước Param(M) FLOPs(G)

Cụ thể hơn kiến trúc các mô hình được trình bày cụ thê ở các mục tiếp theo bêndưới

30

Trang 40

3.2.1 LeViT

LeViT [50] là một kiến trúc tối ưu hóa được xây dựng dựa trên những thànhcông của ViT và DeiT, đồng thời tích hợp các thành phần hữu ích cho các kiến trúcmạng tích chập Xây dựng thiết kế giảm đáng kê độ phân giải trong hai giai đoạn đầucủa ResNet, mô hình kết hợp các nguyên tắc từ mạng nơ-ron tích chập và kiến trúcdựa trên cơ chế “Attention” Đề tối ưu hóa giữa tốc độ và độ chính xác bang cach su

dụng kích thước embedding nhỏ hon va it attention heads hơn so với các mô hình dựa

trên Transformer khác, chăng hạn như ViT (Vision Transformer) LeViT nhận đầuvào là một hình ảnh có kích thước 224 x 224 và sử dụng 4 lớp tích chập 3x3 dé giảm

độ phân giải mà không mất thông tin quan trọng Dé giảm chi phí tính toán, LeViTgiảm hệ số mở rộng của MLP (multi-layer perceptron) tích chập từ 4 xuống 2 Mô

hình được đánh giá trên tập dữ liệu ImageNet-2012 và vượt qua các mô hình hiện có

-7S pe tonuane _ spt5 9 vonuane g speoy uonueye

Hình 3.2 Sơ đô kiến trúc của LeViT

3.2.2 SimpleViT

SimpleViT [51] là một phiên bản được sửa đổi từ mô hình Vision Transformer

(ViT) gốc, có nhiều cải tiến đáng kể về hiệu suất khi được huấn luyện và đánh giá

trên tập dữ liệu ImageNet-1k sử dụng trên mô hình nhỏ hơn là ViT-S/16 do mô hìnhnày đơn giản và có khả năng mở rộng Kết quả sau khi thử nghiệm chứng minh răng

các kỹ thuật tăng cường dữ liệu là đủ để mô hình Vision Transformer hoạt động tốt

trên tập dữ liệu lớn như ImageNet-1k, chi với các sửa đôi nhỏ như là: sử dụng batch

có kích thước nhỏ hơn, global average-pooling, nhúng vị trí sin-cos 2D cố định va

RandAugment và Mixup có số lượng nhỏ dẫn đến cải thiện hiệu suất.

31

Ngày đăng: 02/10/2024, 05:03

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN