2.1 M6 ta bài toán
Nông nghiệp ứng dụng công nghệ thông tin đang trở thành xu thế mới, cải
thiện đáng kế nền nông nghiệp ở nhiều nơi, nhất là trong điều kiện biến đôi khí hậu như hiện nay. Công nghệ thông tin ngày cảng được ứng dụng rộng rãi trong nông nghiệp, lĩnh vực phát triển nhất của nước ta. Các ứng dụng, hệ thống phát hiện và nhận dạng sâu bệnh sử dụng kỹ thuật xử lý ảnh va thị piác máy tính đang thu hút nhiều nhà nghiên cứu trong và ngoài nước.
Sắn là một loại cây được trồng rộng rãi ở vùng nhiệt đới và là lương thực chính ở những vùng này. Tuy nhiên, mặc dù có khả năng chống chịu với các điều
kiện khắc nghiệt, sẵn thường bị ảnh hưởng bởi các bệnh do vi rút gay ra, có thê gây
thiệt hại nghiêm trọng đến năng suất cây trồng. Do đó, một quy trình quan trọng trong canh tác săn là xác định các cây bị bệnh để có thê loại bỏ chúng kịp thời trước khi bệnh lây lan thêm. Quy trình kiếm tra này theo truyền thống thường được thực hiện thủ công bởi các chuyên gia nông nghiệp, nhưng việc này vừa tốn kém vừa không hiệu quả. Với sự trưởng thành gần đây của thị giác máy tính, hy vọng rằng quá trình kiếm tra có thê được giao cho máy móc trong tương lai rất gần. Việc triển khai các mô hình học máy, học sâu có thé phan loại chính xác các cây sẵn bị bệnh có thê cung cấp một công cụ hiệu quả và tiết kiệm chỉ phí dé hỗ trợ nông dân trồng săn bảo vệ cây trồng của họ.
Nghiên cứu nảy trình bày phương pháp đề phát hiện và nhận dạng sâu bệnh trên lá sắn. Bài toán được giải quyết thông qua hai giai đoạn chính là: phát hiện vùng ứng viên có khả năng là sâu bệnh; nhận dạng sâu bệnh từ các vùng ứng viên đã phát hiện.
2.2. Yêu cầu
e©_ Tính tiện dụng: Trang web phải dễ đọc, đễ hiểu, đễ dùng. Thiết kế phải mới, tuy nhiên không quá phức tạp gây khó chịu cho người dung.
e_ Tính đúng đắn: Ứng dụng chạy không lỗi.
16
e §=Tinh thich nghi: Ung dung co thé chay tốt trên nhiều thiết bị với cấu hình phần cứng khác nhau và thiết kế kiến trúc thiết bị khác nhau.
e Tinh tién hoa: Ung dung phai dé dàng được phát triển thêm tính năng ma không gây ảnh hưởng đến những tính năng đã phát triển trước đó.
2.3. Phân tích dữ hiệu khám pha
Các hình ảnh được phân thành năm loại, bốn trong số đó là các bệnh khác nhau ma cây có thé mac phải. Loại thứ năm là cây khỏe mạnh không bị bệnh nảo trong số bốn loại bệnh trên. Số lượng hình anh trong tập đữ liệu đào tạo cho mỗi lớp được xác định như sau:
e Bệnh bạc lá do vi khuẩn sắn (CBB) e Bệnh đốm nâu trên sắn (CBSD) e Sau xanh trên cây sắn (CGM) e Bénh kham san (CMD)
e Cay khoe manh
Bước tiếp theo là là kiểm tra một số hình ảnh đại diện từ mỗi lớp được lấy ngẫu nhiên đề cố gang xac dinh bang mắt một một số đặc điểm có thé duoc mé hinh khai thác. Các bức ảnh được chụp ở nhiều góc độ và điều kiện ánh sáng và góc độ chụp khác nhau.
Tập dữ liệu được thay đối kích thước thành 96x96 và sau đó CNN được đảo tạo với 2 lớp chập và hai lớp dày đặc. Lớp chập thứ nhất và thứ hai có 32 bộ lọc với nhân 3x3 và 64 bộ lọc với nhân 3x3 tương ứng. Tông hợp tối đa được thực hiện sau
mỗi lớp tích chập. Hai lớp dảy đặc có 200 tế bào thần kinh và 5 tế bảo thần kinh (một cho mỗi lớp). Độ chính xác xấp xỉ 65%. Tập dữ liệu lớn hơn sẽ cung cấp cho
mô hỉnh một loạt hình ảnh đa dạng hơn để đào tạo, do đó, nó có thê thu nhận các đặc điểm tính tế hơn giúp phân biệt các lớp khác nhau.
17
2.4. Chuẩn bị dữ liệu
Tập dữ liệu gồm 21.367 hình ảnh được dân nhãn được thu thập trong một cuộc khảo sát thường xuyên 6 Uganda. Hau hết các hình ảnh có nguồn gốc từ những người nông dân chụp ảnh khu vườn của họ và được chú thích bởi các chuyên g1a tại Viện Nghiên cứu Tài nguyên Cây trồng Quốc gia (NaCRR]) phối hợp với phòng thi nghiệm AI tại Đại học Makerere, Kampala. Đây là định dạng thể hiện thực tế nhất những gì nông dân cần chân đoán trong cuộc sống thực.
Dữ liệu được phân ra thành 5 loại: 4 loại bệnh và lá khoẻ mạnh.
- Cac tap tin:
e [train / test] _images các tệp hình ảnh.
e imàe 1d: tên tệp hình ảnh.
e Label: ma ID cua bệnh.
e sample_submission.csv: Ban gửi mẫu được định dạng đúng, với nội dung bộ thử nghiệm được tiết lộ.
e image_id: tén tép hinh anh.
®_ label mã ID: dự đoán cho bệnh.
e [train / test] _tfrecords tép hinh anh ở dinh dang tfrecord.
© label num to _disease map.json Ánh xạ giữa mỗi mã bệnh và tên bệnh thực.
2.5. Phân tích yêu cầu hệ thống
2.5.1 Usecase Upload hình ảnh Mô tả usecase:
Tóm tắt: Use case này thể hiện chức năng chính của hệ thống.
Dòng sự kiện chính:
1. Người dùng mở ứng dụng.
2. Đưa người dùng đến màn hình chính.
18
3. Người dùng load ảnh có sẵn vào phần upload image hiển thị trên màn hình
chính và chờ kết quả từ hệ thông.
Hệ thống hiền thị kết quả.
Người dùng chọn thao tác phù hợp đề thực hiện.
Hệ thống lưu lại kết quả của hoạt động.
Kết thúc.
Nn 2a Ss
Tiền điều kiện: Người đùng mở ứng đụng. CSDL được load thành công.
Hậu điêu kiện: Lưu lại việc thực thị các thao tác trên hệ thông (nêu có).
Biéu do Use case
Upload hinh anh Cây khỏe mạnh
ôincludeằ
Seer Le series Bém knam sin >
eee ôôiticludeằ >
User HE See ---77"" ôincludeằ
hi Bệnh sâu xanh
++." >+---. ôincludeằ
Bệnh đốm nâu
Bệnh bạc lá
iv
Hinh 10. Biéu dé Usercase Activity Diagram
@® Trang chủ Upload ant : Lãy thông tin từ esol)
Thông báo kết quả đến người dùng
Hinh 11, Activity Diagram
19