Bài viết này đề xuất một giải pháp trong nhận dạng bệnh hại trên lúa thông qua ảnh chụp từ thiết bị di động. Ảnh đầu vào được tiền xử lý và rút trích đặc trưng SIFT sau đó được phân lớp bằng mô hình máy học SVM.
Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX “Nghiên cứu ứng dụng Công nghệ thông tin (FAIR'9)”; Cần Thơ, ngày 4-5/8/2016 DOI: 10.15625/vap.2016.00020 GIẢI PHÁP NHẬN DẠNG BỆNH TRÊN LÚA TỪ THIẾT BỊ DI ĐỘNG THƠNG MINH Nguyễn Hữu Hịa, Lâm Tấn Phƣơng, Nguyễn Thái Nghe Khoa Công nghệ thông tin Truyền thông Trường Đại học Cần Thơ {ntnghe,nhhoa}@ctu.edu.vn, ltphuong@tdu.edu.vn TÓM TẮT — Bài viết đề xuất giải pháp nhận dạng bệnh hại lúa thông qua ảnh chụp từ thiết bị di động Ảnh đầu vào tiền xử lý rút trích đặc trưng SIFT sau phân lớp mơ hình máy học SVM Bài viết tập trung nghiên cứu loại bệnh hại lúa phổ biến Việt Nam bệnh cháy bìa lá, cháy (đạo ơn), bệnh đốm vằn bệnh vàng với tổng số hình ảnh thu thập 1446 Kết kiểm thử từ tập ảnh thu thập từ thực tế cho thấy độ xác đạt 79,63% Giải pháp tiền đề để xây dựng ứng dụng thiết bị di động phục vụ nông nghiệp thông minh nhằm giúp người nông dân xác định sớm bệnh hại lúa phòng trừ bệnh kịp thời Từ khoá— Nhận dạng bệnh lúa, ứng dụng di động, đặc trưng SIFT, máy học SVM I GIỚI THIỆU Việt Nam nước có nhiều người dân làm nghề trồng trọt, đặc biệt việc trồng lúa, chiếm gần 72% lực lượng lao động nước Trong Đồng sơng Cửu Long (ĐBSCL) chiếm khoảng 52% tổng sản lượng lúa nước, hàng năm đóng góp 90% sản lượng gạo xuất Sản xuất lúa có vai trị đặc biệt quan trọng việc đảm bảo an ninh lương thực quốc gia góp phần tích cực xuất Tuy nhiên, để trì tăng trưởng ổn định sản xuất lúa gạo nước ta, cần có giải pháp bền vững Những năm qua, ảnh hưởng biến đổi khí hậu mơi trường gây đe dọa lớn sản xuất lúa bền vững, bùng phát loại bệnh hại lúa côn trùng hại lúa Theo số liệu thống kê Bộ Nông nghiệp Phát triển nơng thơn tình hình dịch hại lúa tháng đầu năm 2016 ĐBSCL như: Bệnh bạc (cháy bìa lá), Bệnh đạo ơn (cháy lá), Sâu đục thân, Vàng lá, với tổng diện tích nhiễm gần 37,036 Việc phát kịp thời tình hình dịch hại sản xuất lúa quan trọng nhu cầu cấp thiết, vậy, để thực việc địi hỏi nơng dân cần trang bị kỹ thuật công nghệ cao Thực tế, phần lớn nông dân lại chưa hỗ trợ ứng dụng/kỹ thuật cơng nghệ cao để phát sớm dịch bệnh nhằm điều trị kịp thời Hiện tại, thiết bị di động thông minh (smart mobile devices) phổ biến, rẻ tiền dễ sử dụng phần lớn người dùng, có nơng dân Chính việc xây dựng ứng dụng có khả nhận dạng/phát phân loại bệnh hại lúa từ ảnh chụp thiết bị di động thiết thực khả thi Bài viết đề xuất giải pháp Xây dựng hệ thống nhận dạng bệnh lúa thông qua ảnh chụp từ thiết bị di động, trước mắt thử nghiệm thiết bị chạy hệ điều hành Android tính phổ biến giá thành phù hợp với phần lớn nông dân Từ ảnh chụp đầu vào, hệ thống tiến hành trích chọn đặc trưng ảnh (như đặc trưng SIFT) sau đưa vào mơ hình phân lớp (như máy học SVM) để phân lớp/nhận dạng Kết đầu bệnh tương ứng lúa gợi ý số phương pháp phòng trừ bệnh cách chăm sóc lúa cho đạt suất cao II CƠ SỞ LÝ THUYẾT VÀ NGHIÊN CỨU LIÊN QUAN A Các loại bệnh lúa Mặc dù có nhiều loại bệnh hại lúa, nghiên cứu trước mắt tập trung phân loại 04 loại bệnh thƣờng xảy ĐBSCL bệnh Cháy bìa lá, bệnh Cháy (đạo ôn), bệnh Vàng lá, bệnh Đốm vằn thể Hình Triệu chứng loại bệnh lúa [1] viết tập trung nghiên cứu lúa bị nhiễm bệnh B Biểu diễn ảnh đặc trưng SIFT mơ hình Bag of Words (BoW) 1) Trích chọn đặc trưng cục bất biến SIFT Trích chọn đặc trưng q trình xử lý ảnh đầu vào thành véctơ đặc trưng n chiều Mỗi chiều phản ánh đặc trưng ảnh Trích chọn đặc trưng bước quan trọng ảnh hưởng trực tiếp đến kết hệ thống nhận dạng nói chung, hệ thống nhận dạng ảnh lúa bệnh nói riêng Hiện có nhiều phương pháp trích chọn đặc trưng ảnh Nhưng nhìn chung có bốn phương pháp để trích chọn đặc trưng ảnh: Đặc trưng màu sắc, đặc trưng kết cấu, đặc trưng hình dạng đặc trưng cục bất biến SIFT (Scale-Invariant Feature Transform) [3][4][6] Trong SIFT phương pháp áp dụng hiệu quả, với ưu điểm không phụ thuộc việc thay đổi tỷ lệ, quay ảnh, góc nhìn, ảnh bị nhiễu đơi thay đổi độ sáng mức độ chấp nhận Nghiên cứu sử dụng phương pháp trích chọn đặc trưng SIFT GIẢI PHÁP NHẬN DẠNG BỆNH TRÊN LÚA TỪ THIẾT BỊ DI ĐỘNG THƠNG MINH 160 Hình Bốn loại bệnh phổ biến lúa Từ trái sang phải: a Bệnh cháy bìa lá; b Bệnh cháy (đạo ôn); c Bệnh vàng lá; d Bệnh đốm vằn Các đặc trưng SIFT trích chọn từ điểm đặc biệt cục (Local Interest Point) [5][6][8], vị trí “đặc biệt” ảnh “Đặc biệt” có nghĩa điểm có đặc trưng bất biến với việc quay ảnh, co giãn ảnh hay thay đổi cường độ chiếu sáng ảnh Phương pháp trích chọn đặc trưng SIFT thực theo bước: - Phát điểm cực trị Scale-Space: Bước tiến hành tìm kiếm điểm đặc biệt tất tỉ lệ vị trí ảnh Nó sử dụng lọc Different-of-Gaussian để xác định tất điểm đặc biệt tiềm mà bất biến với quy mô hướng ảnh - Định vị điểm đặc biệt (keypoint localization): Một hàm kiểm tra đưa để định xem điểm đặc biệt tiềm có lựa chọn hay khơng Phân tích điểm đặc biệt tiềm năng, lấy thơng tin về: Vị trí, Tỷ lệ, Tỷ lệ độ cong sở (pricipal curvature) Loại bỏ điểm cực trị khơng phù hợp: Điểm có độ tương phản thấp (không ổn định ảnh bị nhiễu), điểm vị trí khơng thuận lợi dọc theo cạnh - Xác định hƣớng cho điểm đặc biệt (Orientation assignment): Dựa vào hướng điểm đặc biệt, biết điểm đặc biệt bất biến với quay ảnh Tại điểm đặc biệt, trích xuất ảnh Gaussian (khung Gaussian) chứa điểm lân cận điểm đặc biệt sau tính tốn độ lớn hướng cho điểm đặc biệt - Mô tả điểm đặc biệt (Keypoint descriptor): Các điểm đặc biệt sau xác định hướng mô tả dạng vector đặc trưng nhiều chiều (thường 128 chiều) Sau phân tích đặc trưng ảnh đầu vào thu tập véctơ đặc trưng khác nhau, tập véctơ thường lớn Để làm liệu đầu vào cho giải thuật máy học SVM, nghiên cứu đề xuất sử dụng mơ hình “bag of words” [9] 2) Mơ hình Bag of Words (BoW) Mơ hình Bag of Words (BoW) mơ hình sử dụng phổ biến lĩnh vực phân loại, nhận dạng, phát truy vấn ảnh dựa nội dung [3], [4], [9] Mơ hình xuất phát từ lĩnh vực xử lý ngôn ngữ tự nhiên, dùng để biểu diễn tài liệu câu tập hợp từ (words) mà không quan tâm đến thứ tự (như túi đựng - bag) cấu trúc ngữ pháp chúng Trong lĩnh vực thị giác máy tính (computer vision) mơ hình BoW áp dụng để phân lớp ảnh cách xem đặc trưng ảnh từ văn [2] Hình Minh họa mơ hình Bag of Words (BoW) Nguyễn Hữu Hịa, Lâm Tấn Phương, Nguyễn Thái Nghe 161 Sử dụng mơ hình BoW để biểu diễn ảnh bao gồm bước minh họa Hình [10]: - Trích chọn đặc trƣng ảnh: Ảnh sau trích chọn đặc trưng, đại diện tập véctơ, chúng đầu vào cho thuật toán gom cụm (clustering algorithm) Kế tiếp, sử dụng thuật toán gom cụm để gom nhóm đặc trưng cục bộ, xây dựng tập visual words - Gán đặc trƣng cục ảnh vào visual words gần nhất: người ta thường hay sử dụng khoảng cách Euclidean để tính khoảng cách từ đặc trưng đến visual words gần - Xây dựng biểu đồ BoW: thông thường, người ta hay sử dụng mơ hình khơng gian véctơ để biểu diễn hình ảnh Ảnh biểu diễn véctơ với đặc trưng visual words Các véctơ gọi lược đồ BoW (BoW histograms) Đây véctơ đại diện cho ảnh C Các cơng trình nghiên cứu liên quan Ứng dụng điện thoại di động để nhận dạng bệnh hại lúa nhiều nhà nghiên cứu nước quan tâm nghiên cứu tính ứng dụng rộng rãi ngồi thực tiễn Nhóm tác giả [5] sử dụng phương pháp entropy mờ Mạng nơron xác suất, Nghiên cứu [7] sử dụng phương pháp chuyển ảnh từ RGB sang hệ màu YCbCr so sánh Histogram Trong nghiên cứu đề xuất sử dụng phương pháp trích chọn đặc trưng SIFT phân lớp SVM để phân loại bệnh lúa III XÂY DỰNG HỆ THỐNG NHẬN DẠNG BỆNH TRÊN LÚA A Mơ hình nhận dạng bệnh lúa Mơ hình nhận dạng bệnh lúa đề xuất Hình 3, gồm giai đoạn Giai đoạn 1: Trích đặc trưng SIFT; Giai đoạn 2: Biểu diễn ảnh mơ hình Bag of Words xây dựng liệu huấn luyện cho phân lớp SVM; Giai đoạn 3: Huấn luyện mơ hình SVM sử dụng việc phân lớp Chi tiết trình bày 1) Giai đoạn 1: Trích đặc trưng SIFT từ ảnh đầu vào Tập huấn luyện Is bao gồm file It (1 ≤ t ≤ s) thuộc lớp cho trước (4 lớp), file chủ đề lưu chung thư mục Mỗi file It chứa tập véctơ 128 chiều mô tả đặc trưng SIFT ảnh Để tạo file It từ ảnh gốc cho trước cần thực qua bước sau: - Chuyển đổi ảnh không gian màu Grayscale - Trích chọn mơ tả đặc trưng SIFT ảnh mức xám tạo Phần module thực mô tả đặc trưng cục ảnh lưu dạng ma trận Sau trình này, ta thu file It cho tập huấn luyện Hình Mơ hình nhận dạng bệnh lúa GIẢI PHÁP NHẬN DẠNG BỆNH TRÊN LÚA TỪ THIẾT BỊ DI ĐỘNG THÔNG MINH 162 2) Giai đoạn 2: Biểu diễn ảnh BoW Sau giai đoạn 1, ta có tập liệu Is bao gồm file chứa tập véctơ 128 chiều mô tả đặc trưng SIFT ảnh Trong giai đoạn 2, ta thực bước: - Sử dụng giải thuật k-means để gom cụm véctơ 128 chiều với số cụm (cluster) cho trước (trong nghiên cứu này, k=200 cho độ xác cao – mơ tả phần thực nghiệm) Các visual words tâm cluster Lưu lại visual words vào file dictionary.xml - Tính khoảng cách Euclidean từ véctơ đặc trưng SIFT ảnh đến visual words Gán véctơ vào visual words gần - Tính tần số xuất visual words ảnh Như vậy, ảnh biểu diễn véctơ tần số xuất visual words - Thực gán nhãn cho véctơ tần số ghi lại làm file huấn luyện cho mô hình phân lớp SVM 3) Giai đoạn 3: Huấn luyện mơ hình SVM Để huấn luyện mơ hình SVM, nghiên cứu sử dụng công cụ LibSVM [11] để huấn luyện mơ hình LibSVM số nhiều thư viện hỗ trợ cho SVM LibSVM hỗ trợ nhiều ngôn ngữ phổ biến C++ Java chạy nhiều hệ điều hành khác như: Windows, Linux LibSVM thư viện đơn giản dễ sử dụng dùng để phân lớp (C-SVC, nu-SVC) hay hồi quy (epsilon-SVR, nu-SVR) hỗ trợ phân lớp đa lớp (multiclass classification) Mặc dù vậy, ta sử dụng thư viện khác có hỗ trợ SVM (như Weka, ) B Kết 1) Môi trường cài đặt giao diện hệ thống Hệ thống nhận dạng bệnh lúa thực Android, với ngơn ngữ lập trình Java có tham khảo đến thư viện JavaCV0.7 for android (OpenCV 2.4.8) thư viện LibSVM on Android Hệ thống gồm module chính: Dành cho Quản trị dành cho Nơng dân Module dành cho Nông dân minh hoạ Hình 4a (trái) Ở đó, người dân đơn giản khởi động hệ thống chọn nút “Chụp Ảnh”, sau hệ thống tự động xử lý cho kết phân loại bệnh kèm theo gợi ý phịng trừ Hình 4b (phải) Module dành cho Quản trị gồm chức Load ảnh mẫu; trích đặc trưng Sift cho ảnh vừa load; Tạo visual words cho tập ảnh liệu; Tạo lược đồ Bag-of-Word Tạo file huấn luyện tạo file kiểm tra cho tập ảnh 2) Dữ liệu thực nghiệm Để thực nghiệm, nhóm tác giả chụp sưu tập ảnh bệnh lúa từ cánh đồng lúa Trà Ôn tỉnh Vĩnh Long Châu Thành A, tỉnh Hậu Giang hỗ trợ chuyên môn kỹ sư trạm bảo vệ thực vật huyện Châu Thành A – Hậu Giang Ảnh chụp điện thoại Asus Zenfone chạy hệ điều hành Android phiên 4.3 có 8Mpx điệu kiện ánh sáng ban ngày bình thường Ảnh chụp với khoảng cách từ 10-20 cm từ camera điện thoại đến lúa, ảnh thu định dạng đuôi png Tổng số ảnh thu 1446 ảnh bao gồm lớp: Cháy bìa lá, cháy lá, đốm vằn, vàng lớp không bệnh Chi tiết mô tả Bảng Hình Giao diện hệ thống dành cho nơng dân Nguyễn Hữu Hịa, Lâm Tấn Phương, Nguyễn Thái Nghe 163 Bảng Tập liệu hình ảnh 3) Cháy bìa Cháy Đốm vằn Vàng Khơng bệnh Tổng số Tập huấn luyện 208 251 204 187 110 960 Tập kiểm tra 100 124 105 95 62 486 Tổng 308 375 309 282 172 1446 Đánh giá kết Để đánh giá kết quả, nghiên cứu sử dụng độ đo Accuracy, Precision, Recall, F1-Measure nghi thức kiểm tra chéo (5-fold cross validation) Với mơ hình SVM, chúng tơi sử dụng phương pháp tìm kiếm siêu tham số (hyperparameter search) có sẵn cơng cụ grid.py thư viện LibSVM, kết minh hoạ Bảng với hàm nhân RBF (Radial Bias Function) Trong C gamma siêu tham số mơ hình SVM, cịn K số cụm mơ hình kMean giai đoạn trình bày phần III.A Độ xác sau mơ hình 79.63% Bảng Tương quan độ xác siêu tham số K, C gamma K 50 80 100 150 200 250 C 2 2 gamma 2 8 Độ xác 72.22% 76.34% 78.6% 73.44% 79.6% 74.69% Kết phân lớp lớp theo độ đo Precision, Recall F1-measure trình bày chi tiết Bảng 3, kết trung bình đạt độ xác 81% Bảng Độ xác lớp Lớp Precision Recall F1-measure Cháy bìa 71.56% 78.00% 74.64% Cháy 92.73% 82.26% 87.18% Đốm vằn 67.68% 63.81% 65.69% Vàng 73.58% 82.11% 77.61% Lá không bệnh 100% 100% 100% Avg/total 81.11% 81.23% 81.02% Ngồi ra, để xem tính khả thi việc xử lý ảnh thiết bị di động, chúng tơi trình bày kết trung bình việc xử lý ảnh Bảng Trung bình khoảng 1s kết quả, việc nhận dạng bệnh lúa thiết bị di động hoàn toàn khả thi Kết nghiên cứu bước đầu đáp ứng việc hỗ trợ nông dân phát bệnh hại lúa để có biện pháp phịng trừ kịp thời Bảng Chi tiết thời gian thực nhận dạng điện thoại Ram CPU Hệ điều hành Asus Zenfone Lenovo A369i GB 512 MB Intel Atom Z2560, 1.6 GHz MTK 6572, 1.3 GHz 4.3 (Jelly Bean) 4.2 (Jelly Bean) Trích đặc trưng SIFT ảnh 525 ms 850 ms Véctơ hóa ảnh ghi thành file txt 516 ms 425 ms Phân lớp ảnh 53 ms 65 ms 1.094 ms 1.340 ms Tổng thời gian 164 GIẢI PHÁP NHẬN DẠNG BỆNH TRÊN LÚA TỪ THIẾT BỊ DI ĐỘNG THÔNG MINH IV KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN Bài viết đề xuất giải pháp nhận dạng bệnh hại lúa thông qua ảnh chụp từ thiết bị di động Ảnh đầu vào xử lý rút trích đặc trưng SIFT sau phân lớp mơ hình máy học SVM Bài viết đề xuất mô hình tổng qt việc nhận dạng thơng qua bước chi tiết Hiện tại, nghiên cứu tập trung loại bệnh hại lúa phổ biến Việt Nam bệnh cháy bìa lá, cháy (đạo ôn), bệnh đốm vằn bệnh vàng lá, việc mở rộng cho loại bệnh khác hoàn toàn khả thi cần thu thập thêm liệu huấn luyện lại mơ hình Kết bước đầu cho thấy giải pháp tiền đề để xây dựng ứng dụng thiết bị di động phục vụ nông nghiệp thông minh nhằm giúp người nông dân xác định sớm bệnh hại lúa phòng trừ bệnh kịp thời Tuy nhiên, yếu tố lấy ảnh đầu vào đóng vai trị quan trọng đến kết trình nhận dạng ảnh Trong thực tế, để đơn giản việc xử lý nhiễu, chụp ảnh, lúa bệnh đặt vải giấy, carton làm không để lúa bị chiếu trực tiếp với ánh nắng mặt trời, đồng thời người chụp ảnh cần phải cầm điện thoại để ảnh khơng bị nhịe Đảm bảo tốt yếu tố kết nhận dạng ảnh xác Trong tương lai, tiếp tục bổ sung thêm nhiều loại bệnh hại lúa khác để chương trình mở rộng việc nhận dạng Thêm vào đó, đưa chương trình ứng dụng thực tế thử nghiệm để thu thập ý kiến nơng dân nhằm hồn thiện thêm chương trình Đồng thời, phát triển chương trình khơng chạy hệ điều hành Android mà cịn chạy điện thoại chạy hệ điều hành khác IOS, Window phone TÀI LIỆU THAM KHẢO [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] Nguyễn Thị Quỳnh Liên (2012), “Giáo trình phịng trừ cỏ dại, sâu bệnh hại lúa”, Bộ Nông nghiệp Phát triển nông thôn Đỗ Thanh Nghị, Phạm Nguyên Khang (2013), “Phân lớp ảnh với giải thuật giảm gradient ngẫu nhiên đa lớp”, Tạp chí khoa học Trường Đại học Cần Thơ, 29(2013), tr 1-7 David G Lowe (2004), “Distinctive Image Features from Scale-Invariant Keypoints”, International Journal of Computer Vision, PP 91-110 Kamarul Hawari Ghazali (2007) “Feature Extraction technique using SIFT keypoints descriptors” The International Conference on Electrical and Engineering and Informatics Kholis Majid, Yeni Herdiyeni, Aunu Rauf (2013), “Mobile Application for Paddy Disease Identification using Fuzzy Entropy and Probabilistic Neural Network” Mohamed Aly (2006) "Face recognition using SIFT features." CNS/Bi/EE report 186 (2006) Rahat Yasir, Nova Ahmed (2014), EECS Department, North South University Dhaka, Bangladesh, “A Mobile Application to Detect Crop Disease for Farmers in Rural Area” Stephanie Pancoast, “Acoustic Features for Multimedia Event Classification”, CS 229 Project: Final Report Thomas Deselaers, Lexi Pimenidis, Hermann Ney (2008), “Bag-of-Visual-Words Models for Adult Image Classification and Filtering”, International Conference on Pattern Recognition ICPR, 19, PP.1-4 Huỳnh Bé Thơ (2013), “Xây dựng công cụ ngăn chặn việc truy cập web đen (hình ảnh, nội dung)”, Luận văn thạc sĩ Công nghệ thông tin Khoa Công nghệ thông tin Truyền thông, Đại học Cần Thơ C.-C Chang and C.-J Lin LIBSVM : a library for support vector machines ACM Transactions on Intelligent Systems and Technology, 2:27:1 27:27, 2011 Bag of visual words model: recognizing object categories, http://www.robots.ox.ac.uk/~az/icvss08_az_bow.pdf AN APPROACH FOR RICE LEAF’S DISEASE RECOGNITION USING SMART DEVICES Nguyen Huu Hoa, Lam Tan Phuong, Nguyen Thai Nghe ABSTRACT — This work proposes an approach for rice leaf’s disease recognition using images captured from smart devices The input images are extracted their SIFT features Then, these features are processed using Bag-of-Word model before classifying using SVM Experiments are conducted on popular diseases on the rice leaf’s Results on 1446 images show that the proposed approach can correctly classify at 79,63% of accuracy This approach would be potential for building smart applications for agriculture Keywords — Rice leaf’s disease recognition, mobile applications, SIFT, SVM ... gian 164 GIẢI PHÁP NHẬN DẠNG BỆNH TRÊN LÚA TỪ THIẾT BỊ DI ĐỘNG THÔNG MINH IV KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN Bài viết đề xuất giải pháp nhận dạng bệnh hại lúa thông qua ảnh chụp từ thiết bị di động. ..GIẢI PHÁP NHẬN DẠNG BỆNH TRÊN LÚA TỪ THIẾT BỊ DI ĐỘNG THƠNG MINH 160 Hình Bốn loại bệnh phổ biến lúa Từ trái sang phải: a Bệnh cháy bìa lá; b Bệnh cháy (đạo ơn); c Bệnh vàng lá; d Bệnh đốm... thu file It cho tập huấn luyện Hình Mơ hình nhận dạng bệnh lúa GIẢI PHÁP NHẬN DẠNG BỆNH TRÊN LÚA TỪ THIẾT BỊ DI ĐỘNG THÔNG MINH 162 2) Giai đoạn 2: Biểu di? ??n ảnh BoW Sau giai đoạn 1, ta có tập liệu