So sánh các phương pháp kết hợp giữ xử lý ảnh và máy học trong việc nhận dạng mẫu ứng dụng cho nhận biết bệnh trên lá cà phê

9 19 0
So sánh các phương pháp kết hợp giữ xử lý ảnh và máy học trong việc nhận dạng mẫu ứng dụng cho nhận biết bệnh trên lá cà phê

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài viết này được tổ chức như sau: phần hai sẽ đánh giá các nghiên cứu hiện tại liên quan đến vấn đề đang trình bày; phần ba sẽ trình bày giải pháp mà nhóm tác giả đề xuất để so sánh các phương pháp nhằm chọn ra phương pháp tốt nhất; phần bốn sẽ là phần thực nghiệm và đánh giá; cuối cùng là phần kết luận và các thảo luận liên quan đến kết quả thu được.

168 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC So sánh phương pháp kết hợp giữ xử lý ảnh máy học việc nhận dạng mẫu ứng dụng cho nhận biết bệnh cà phê Lê Văn Minh Khoa Công nghệ Thông tin Truyền thông, Đại học Đà Nẵng, Việt Nam vanminh.le246@gmail.com Tóm tắt Hiện nay, Việt Nam nước xuất cà phê hàng đầu giới Thực tế việc phát triển cà phê nước ta gặp thách thức mơi trường bệnh dịch khí hậu nhiệt đới gió mùa thuận lợi cho sâu bệnh phát triển Với phát triển công nghệ thông tin ngành nghiên cứu chuyên sâu xử lý ảnh máy học, việc nhận dạng đưa định dựa hình ảnh ngày áp dụng rộng rãi Điều thúc đẩy nhóm tác giả nghiên cứu phương pháp để ứng dụng thành tựu có xử lý ảnh máy học vào việc nhận dạng bệnh cà phê dựa hình ảnh Trong báo này, nhóm tác giả tổng hợp so sánh giải pháp kết hợp xử lý ảnh thuật tốn máy học tốn nhận dạng Nhóm tác giả cịn minh họa tốn nhận dạng bệnh cà phê dựa vào hình ảnh cà phê Từ khóa: máy học; nhận dạng mẫu; xử lý ảnh; trích xuất đặt trưng; tìm đường bao; Giới thiệu 1.1 Nhận dạng bệnh dựa cà phê Hiện nay, Việt Nam nước đứng thứ hai giới xuất cà phê[1] Diện tích trồng cà phê khoảng 643.159 tăng lên năm tiếp theo[2] Thực tế việc phát triển cà phê nước ta gặp thách thức môi trường bệnh dịch khí hậu nhiệt đới gió mùa thuận lợi cho sâu bệnh phát triển Điều thúc đẩy giới khoa học nghiên cứu việc xác định loại bệnh cà phê Thơng thường, để chẩn đốn bệnh trồng người nông dân dựa vào kinh nghiệm Cụ thể người nơng dân quan sát cà phê dùng kinh nghiệm để chẩn đốn bệnh Việc chẩn đốn bệnh dựa kinh nghiệm vấn đề nơng dân khơng phải người dân có kiến thức bệnh trồng, việc phát bệnh kinh nghiệm không kịp thời tỉ lệ xác chưa cao dẫn đến nhiều thiệt hại kinh tế Vì cần sử dụng phương pháp xác định bệnh nhanh chóng để nơng dân có phương pháp xử lý kịp thời Với phát triển công nghệ thông tin ngành nghiên cứu chuyên sâu xử lý ảnh[3] máy học[4], việc nhận dạng đưa định dựa hình ảnh ngày áp dụng rộng rãi[5] Điều thúc đẩy nhóm tác giả nghiên cứu phương pháp để ứng dụng thành tựu có xử lý ảnh máy học để nhận dạng bệnh cà phê dựa vào hình ảnh 1.2 Bài toán cần giải Cho tới nay, nhiều nhóm tác giả cơng bố nhiều cơng trình khác liên quan đến việc kết hợp ưu việt xử lý ảnh máy học để giải vấn đề cụ thể nhận Lê Văn Minh 169 dạng[6] Nhóm tác giả ở[7] trình bày cống hiến xử lý ảnh việc phát điều trị bệnh tiểu đường Ngay lĩnh vực nơng nghiệp, nhiều cơng trình ứng dụng xử lý ảnh vào nhận dạng sử dụng[8][9][10] Trong báo này, tốn mà nhóm tác giả phải giải nhận biết bệnh cà phê dựa vào hình ảnh cà phê Yêu cầu toán cụ thể chương trình nhận diện hình ảnh cà phê làm đầu vào trả kết cà phê bị bệnh Để tăng tính cống hiến cơng trình, nhóm tác cịn giả trình bày việc so sánh giải pháp kết hợp xử lý ảnh máy học với mục đích áp dụng vào việc nhận biết bệnh cà phê dựa hình ảnh cà phê Nhóm tác giả kỳ vọng cơng trình hữu ích cho nghiên cứu sau chọn giải pháp cho toán nhận dạng bệnh trồng dựa vào hình ảnh Bài báo tổ chức sau: phần hai đánh giá nghiên cứu liên quan đến vấn đề trình bày; phần ba trình bày giải pháp mà nhóm tác giả đề xuất để so sánh phương pháp nhằm chọn phương pháp tốt nhất; phần bốn phần thực nghiệm đánh giá; cuối phần kết luận thảo luận liên quan đến kết thu Giới thiệu Nhận định nhóm tác giả toán thuộc loại toán nhận dạng mẫu (pattern recognition)[11][12] Do đó, trình tự bước báo tương ứng với trình tự bước giải tốn nhận dạng nói chung[13][14] 2.1 Tiền xử lý Đối tượng làm việc toán tập ảnh, việc tiền xử lý thực chất xử lý ảnh Đây lý mà nhận dạng mẫu thường gắn liền với xử lý ảnh Phân tích màu Như biết có nhiều hệ thống màu thể cho ảnh[15][16] Để đơn giản, nhóm tác giả đề xuất tập trung vào hệ thống màu RGB[17] Đối với hệ màu này, tổng hợp tất màu khả kiến dựa tỉ lệ ba màu (xanh lục, xanh dương màu đỏ) Việc phân tích kênh màu đóng góp đáng kể cho việc nhận dạng trình bày cơng trình [18][19][20] Trong đề tài này, nhóm tác giả thực phân tích màu cà phê bị bệnh khác màu sắc khác Chi tiết trình bày phần báo Phát biên Phát biên kỹ thuật quan trọng việc tiền xử lý liệu Các phương pháp phát biên canny[21], sobel[22], prewitt[23] góp phần nâng cao độ xác nhận dạng 2.2 Trích xuất đặc trưng Trích xuất đặc trưng xem bước quan trọng việc nhận dạng Bước định chủ yếu độ xác q trình nhận dạng Tuy vậy, việc trích xuất đặc trưng khó phụ thuộc vào toán cụ thể Bài báo tập trung vào việc ứng dụng phương pháp máy học xử lý ảnh, nhóm tác giả chọn phương pháp trích xuất đặt trưng tổng quát Phương pháp chọn Texture Features Phương pháp sử 170 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC dụng cho phần lớn toán nhận dạng ảnh với kết tương đối khả quan Thực tế phương pháp mang lại thành cơng cho nhiều cơng trình như[24][25][26] 2.3 Training testing Training testing hai thuật ngữ quan trọng thân thiện với tất nhà khoa học lĩnh vực máy học, lĩnh vực nhận dạng chí khoa học liệu Trong hai bước này, thơng thường phương pháp máy học (còn gọi với tên classifier) sử dụng để phân lớp đối tượng nghiên cứu Trong báo này, nhóm tác giả tập trung vào phương pháp tiếng như: Support Vector Machine[13][27], Bayes[28], Simple Logistic[29] Đề xuất phương pháp 3.1 Hướng tiếp cận Chúng ta biết deep learning convolution neural network hướng tiếp cận hiệu để giải toán nhận dạng với ảnh Trong cơng trình[30] tác giả trình bày thành tựu ưu điểm convolution neural network Tuy nhiên, convolution neural network nói riêng hay deep learning nói chung yêu cầu liệu lớn với hàng ngàn mẫu thử Trong cơng trình này, chúng tơi thu thập khoảng vài trăm mẫu thử giải pháp bị giới hạn hướng liệu Do đó, cơng trình tác giả khơng sử dụng convolution neural network mà thay vào kết hợp xử lý ảnh phương pháp máy học truyền thông thường để xây dựng giải pháp Trước vào chi tiết đề xuất, nhóm tác giả trình bày tốn cụ thể Bài tốn cụ thể sau: Đầu vào toán ảnh cà phê bị bệnh Kết trả dự đoán rằng: cà phê bị bệnh Trong đề tài này, nhóm tác giả nghiên cứu loại bệnh thông dụng cà phê gồm: Rust Disease, Calcium Deficiency, Protein Deficiency, Iron Deficiency, Kaly Deficiency, Phospho Deficiency, Magnesium Deficiency Nội dung báo kết hợp phương pháp xử lý ảnh thuật toán máy học để nhận dạng bệnh dựa hình ảnh cà phê Do đó, hướng tiếp cận để giải toán bao gồm tất yếu tố Cụ thể, nhóm tác giả đề xuất:  Nhóm nghiên cứu chuẩn bị khoảng 500 ảnh cà phê bị bệnh phân loại (còn gọi dán nhãn) nhờ giúp đỡ chuyên gia nông nghiệp  Các ảnh đầu vào áp dụng thuật toán xử lý ảnh cho bước tiền xử lý  Kết tiền xử lý sử dụng để xây dựng vector đặc tính  Vector đặc tính với phân loại cà phê đưa vào thuật toán máy học để train test ─ Nhóm tác giả sử dụng ngẫu nhiên 60\% ảnh để train 40\% ảnh để test ─ Kết đầu tỉ lệ phần trăm độ xác q trình dự đốn tập liệu test Lê Văn Minh 3.2 171 Tiền xử lý Phân tích màu Trước hết nhóm tác giả phân tích hình ảnh thành kênh màu khác Nghĩa sau phân tích, chương trình thu ảnh xám (gray-scale image) khác tương ứng với kênh màu Ngồi ra, nhóm tác giả tính trung bình kênh màu để thu kênh màu thứ Hình trình bày ảnh cà phê sau phân tích màu Fig Phân tích ảnh màu thành ảnh xám Để có thêm đánh giá định tính nhằm phân biệt khác ảnh tượng trưng cho loại bệnh Nhóm tác giả tính phổ màu (histogram) kênh màu Hình trình bày phổ màu ảnh thu từ bước Phát biên Dựa quan sát thực tế, cà phê bị bệnh thường có chênh lệch màu sắc bên lá,chúng khơng hồn tồn xanh không bị bệnh Sự chênh lệch thể thay đổi hình ảnh thực việc phát biên Điều thúc đẩy tác giả sử dụng việc phát biên bước tiền xử lý với hy vọng tăng độ xác nhận dạng Hình minh họa cho kết sau thực phương pháp Fig Histogram ảnh phân tích 172 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC Fig Kết sau sử dụng thuật toán Canny để tìm đường viền Trích xuất đặc trưng Như trình bày phần trước, nhóm tác giả đề xuất sử dụng phương pháp Texture Feature Thành tựu Texture Feature trình bày nhóm tác giả \cite{mohanaiah2013image} Texture Feature đề tài thay đổi chút để áp dụng vào toán chúng tơi Cụ thể tính trung bình độ sáng ảnh, sau chia ảnh thành tính trung bình điểm sáng ảnh nhỏ tiếp tục lặp lại việc chia Hình trình bày bước lặp việc trích xuất đặc trưng dựa phương pháp Texture Feature Trong đó, hình bên trái hìnhảnh ban đầu, hình bên phải hình ảnh sau chia thành hình khác Với cách làm này, độ dài vector phụ thuộc vào số lần chia Trong tình này, đề xuất giới hạn số lần chia Lê Văn Minh 173 Fig Texture Features Extraction Để làm rõ ảnh hưởng việc áp dụng thuật tốn xử lý ảnh độ xác q trình phân lớp, nhóm tác giả đề xuất nhiều phương pháp trích xuất đặc trưng khác phương pháp cho kết khác độ xác Các phương pháp trích xuất sau:  Extraction 1: trích xuất đặc trưng ảnh xám RGB  Extraction 2: trích xuất đặc trưng ảnh gồm: ảnh xám RGB ảnh trung bình cộng ảnh  Extraction 3: trích xuất đặc trưng ảnh gồm: ảnh RGB ảnh Canny ảnh RGB  Extraction 4: trích xuất đặc trưng ảnh xám RGB sử dụng thêm histogram ảnh xám  Extraction 5: trích xuất đặc trưng ảnh Canny ảnh xám RGB sử dụng thêm histogram ảnh xám  Extraction 6: trích xuất đặc trưng ảnh gồm: ảnh RGB ảnh Canny sử dụng thêm histogram ảnh xám 3.3 Train test Nhóm tác giả đề xuất sử dụng thuật toán máy học để thực nghiệm việc phân loại Các thuật toán bao gồm: SimpleLogistic, AttributeSelectedClassifier, J48, NaiveBayes, LWL 174 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC Kết Kết thực nghiệm cho thấy có mối quan hệ mật thiết tiền xử lý xử lý ảnh phương pháp Như hình thấy phương pháp tiền xử lý tốt với phương pháp máy học không tốt với phương pháp máy học khác Cũng hình này, tác giả thực phép tốn logarit độ xác kết thu với mục đích làm rõ chênh lệch kết chọn thuật toán khác Vì giá trị lớn độ xác 100 (đơn vị %) nên giá trị lớn trục hoành (lg(100) = 2) Fig So sánh kết phương pháp Trong tình này, tác giả phân tích trường hợp tốt trường hợp sử dụng thuật tốn Logistic phương pháp extraction Kết xác phương pháp lên đến 95% Hình trình bày ma trận nhầm lẫn trường hợp Đây trường hợp test với 40% số ảnh sở liệu Fig Ma trận nhầm lẫn Kết luận Nhóm tác giả làm rõ tương quan xử lý ảnh (cho việc tiền xử lý) phương pháp máy học nhận dạng mẫu Nhóm tác giả đưa trường hợp nghiên cứu cụ thể là: nhận dạng bệnh dựa hình ảnh cà phê Đóng góp quan trọng Lê Văn Minh 175 báo với toán cụ thể, cần chọn phương pháp máy học phù hợp với phương pháp tiền xử lý để thu kết tốt Về hướng phát triển, nhóm tác giả mở rộng đề tài với phương pháp trích xuất đặc trưng khác thay cho phương pháp Texture Feature Mặt khác, nhóm tác giả đề xuất mở rộng với phương pháp deep-learning để tăng độ xác số lượng ảnh nhiều dần Tài liệu tham khảo D WORKMAN: “Coffee exports by country” 2017 [Online; accessed July- 2017] G NAM: “Cà phê việt nam chiếm “ngôi vương” brazil” 2017 [Online; accessed July-2017] M D Abràmoff, P J Magalhães, and S J Ram: “Image processing with imagej” Biophotonics international, vol 11, no 7, pp 36–42, 2004Author, F., Author, S., Author, T.: Book title 2nd edn Publisher, Location (1999) I H Witten, E Frank, M A Hall, and C J Pal, Data Mining: Practical machine learning tools and techniques Morgan Kaufmann (2016) H J Siegel, L J Siegel, F C Kemmerer, M PT Jr, S HE Jr, and S D Smith: “Pasm: A partitionable simd/mimd system for image processing and pattern recognition” IEEE Transactions on computers, no 12, pp 934–947 (1981) T Acharya and A K Ray: Image processing: principles and applications John Wiley & Sons (2005) T Walter, J.-C Klein, P Massin, and A Erginay: “A contribution of image processing to the diagnosis of diabetic retinopathy-detection of exudates in color fundus images of the human retina” IEEE transactions on medical imaging, vol 21, no 10, pp 1236–1243 (2002) A H Kulkarni and R A Patil: “Applying image processing technique to detect plant diseases” International Journal of Modern Engineering Research (IJMER), vol 2, no 5, pp 3661–3664 (2012) V Singh, A Misra, et al.: “Detection of unhealthy region of plant leaves using image processing and genetic algorithm” in Computer Engineering and Applications (ICACEA), 2015 International Conference on Advances in, pp 1028–1032, IEEE (2015) 10 J G A Barbedo: “An automatic method to detect and measure leaf disease symptoms using digital image processing” Plant Disease, vol 98, no 12, pp 1709–1716 (2014) 11 C M Bishop: Pattern recognition and machine learning springer (2006) 12 D W Paulus and J Hornegger: Applied pattern recognition: A practical introduction to image and speech processing in C++ Morgan Kaufmann Publishers (1998) 13 C J Burges: “A tutorial on support vector machines for pattern recognition” Data mining and knowledge discovery, vol 2, no 2, pp 121–167 (1998) 14 J J Hopfield et al.: “Pattern recognition computation using action potential timing for stimulus representation” Nature, vol 376, no 6535, pp 33–36 (1995) 15 K Plataniotis and A N Venetsanopoulos: Color image processing and applications Springer Science & Business Media (2013) 16 S J Sangwine and R E Horne: The colour image processing handbook Springer Science & Business Media (2012) 17 B Lindbloom: “Rgb working space information” Specifications, http://www.brucelindbloom.com/WorkingSpaceInfo html# Specifications (January 2014), 2001 18 G Sulong et al.: “Rgb colour image watermarking using canny edge detection and discrete wavelet transform (dwt)” (2013) 19 K Van De Sande, T Gevers, and C Snoek: “Evaluating color descriptors for object and scene recognition” IEEE transactions on pattern analysis and machine intelligence, vol 32, no 9, pp 1582–1596 (2010) 20 E Sutton: “Histograms and the zone system” Illustrated Photography Accessed at http://www illustratedphotography com/photography- tips/basic/contrast 176 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC 21 J Canny: “A computational approach to edge detection” IEEE Transac- tions on pattern analysis and machine intelligence, no 6, pp 679–698 (1986) 22 I Sobel: “History and definition of the sobel operator” Retrieved from the World Wide Web (2014) 23 J M Prewitt: “Object enhancement and extraction” Picture processing and Psychopictorics, vol 10, no 1, pp 15–19 (1970) 24 D.-C He, L Wang, and J Guibert: “Texture feature extraction” Pattern recognition letters, vol 6, no 4, pp 269–273 (1987) 25 T Ahonen, A Hadid, and M Pietikainen: “Face description with local binary patterns: Application to face recognition” IEEE transactions on pattern analysis and machine intelligence, vol 28, no 12, pp 2037–2041 (2006) 26 M Unser: “Texture classification and segmentation using wavelet frames” IEEE Transactions on image processing, vol 4, no 11, pp 1549–1560 (1995) 27 N Cristianini and J Shawe-Taylor: An introduction to support vector machines and other kernelbased learning methods Cambridge university press (2000) 28 P Domingos and M Pazzani: “On the optimality of the simple Bayesian classifier under zero-one loss” Machine learning, vol 29, no 2-3, pp 103–130 (1997) 29 J M Hilbe: Logistic regression models CRC press (2009) 30 P Y Simard, D Steinkraus, and J C Platt: “Best practices for convolutional neural networks applied to visual document analysis” in null, p 958, IEEE (2003) 31 P Mohanaiah, P Sathyanarayana, and L GuruKumar: “Image texture feature extraction using glcm approach” International Journal of Scientific and Research Publications, vol 3, no 5, p (2013) ... việc so sánh giải pháp kết hợp xử lý ảnh máy học với mục đích áp dụng vào việc nhận biết bệnh cà phê dựa hình ảnh cà phê Nhóm tác giả kỳ vọng cơng trình hữu ích cho nghiên cứu sau chọn giải pháp. .. KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC Kết Kết thực nghiệm cho thấy có mối quan hệ mật thiết tiền xử lý xử lý ảnh phương pháp Như hình thấy phương pháp tiền xử lý tốt với phương. .. trung vào việc ứng dụng phương pháp máy học xử lý ảnh, nhóm tác giả chọn phương pháp trích xuất đặt trưng tổng quát Phương pháp chọn Texture Features Phương pháp sử 170 KỶ YẾU HỘI THẢO KHOA HỌC

Ngày đăng: 17/12/2021, 08:58

Hình ảnh liên quan

Trước hết nhóm tác giả phân tích hìnhảnh thành 3 kênh màu khác nhau. Nghĩa là sau khi phân tích, chương trình sẽ thu được 3 ảnh xám (gray-scale image) khác nhau tương ứng với 3  kênh màu - So sánh các phương pháp kết hợp giữ xử lý ảnh và máy học trong việc nhận dạng mẫu ứng dụng cho nhận biết bệnh trên lá cà phê

r.

ước hết nhóm tác giả phân tích hìnhảnh thành 3 kênh màu khác nhau. Nghĩa là sau khi phân tích, chương trình sẽ thu được 3 ảnh xám (gray-scale image) khác nhau tương ứng với 3 kênh màu Xem tại trang 4 của tài liệu.
3.2 Tiền xử lý - So sánh các phương pháp kết hợp giữ xử lý ảnh và máy học trong việc nhận dạng mẫu ứng dụng cho nhận biết bệnh trên lá cà phê

3.2.

Tiền xử lý Xem tại trang 4 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan