Thông qua các khảo sát vừa được thống kê, chúng ta nhìn nhận rằng, các vấn đề và giải pháp dành cho nông nghiệp là rất đa dạng và phong phú. Dựa trên các khảo sát trên, có thể nắm được những loại ứng dụng nông nghiệp nào hiện đang được quan tâm phân tích. Theo thống kê, các giải thuật phổ biến nhất hiện nay gồm: Support Vector Machine, Neuron Network, Image Processing, Naive Bayes, Fuzzly Logic,v.v. Thống kê này sẽ có ý nghĩa cực kì quan trọng trong việc xác định các lớp giải thuật, các bài toán thường gặp trong thực tế để xây dựng một bộ công cụ phân tích dữ liệu hoàn chỉnh. Ở chương tiếp theo, chúng ta sẽ tìm hiểu một số framework xử lý dữ liệu nổi bật hiện nay, và tìm hiểu phương pháp tích hợp các giải thuật trên vào framework.
14
Chương 3
Khảo sát và lựa chọn framework xử lý dữ liệu
3.1 Đặc điểm dữ liệu nông nghiệp
Dữ liệu lớn trong nông nghiệp là rất không đồng nhất (Wolfert et al.,2017). Ví dụ
về tính không đồng nhất của các dữ liệu: chủ đề của dữ liệu được thu thập, các cách mà dữ liệu được tạo ra, dữ liệu được thu thập từ hiện trường hoặc trang trại bao gồm thông tin về trồng trọt, phun thuốc, vật liệu, sản lượng, hình ảnh trong mùa, loại đất, thời tiết, v.v. Nhìn chung có ba dạng dữ liệu được tạo ra (Devlin,2012):
• Process-mediated (PM): là kết quả từ các quy trình nông nghiệp được ghi lại
và theo dõi, chẳng hạn như mua nguyên liệu đầu vào, cho ăn, gieo hạt, bón phân, đặt hàng, v.v. Dữ liệu PM thường có cấu trúc cao và bao gồm các giao dịch, bảng tham chiếu và các mối quan hệ, cũng như siêu dữ liệu xác định ngữ cảnh của chúng.
• Machine-generated (MG): là số liệu được lấy từ cảm biến và máy móc thông
minh được sử dụng để đo lường và ghi lại các quy trình canh tác. Các thiết bị trên còn được gọi là các thiết bị Internet of Things (IoT). Dữ liệu MG có phạm vi từ các bản ghi cảm biến đơn giản đến các bản ghi máy tính phức tạp và thường có cấu trúc tốt. Khi số lượng các cảm biến nhiều hơn, khối lượng dữ liệu ngày càng tăng, nó ngày càng trở thành một thành phần quan trọng của thông tin canh tác được lưu trữ và xử lý. Bản chất có cấu trúc tốt phù hợp với máy tính xử lý, nhưng kích thước và tốc độ của nó vượt xa các cách tiếp cận truyền thống. Đối với nông nghiệp thông minh, tiềm năng của các máy bay không người lái (UAV) đã được công nhận. Máy bay không người lái có camera hồng ngoại, công nghệ GPS, đang chuyển đổi nền nông nghiệp với sự hỗ trợ của họ để ra quyết định tốt hơn, quản lý rủi ro (Faulkner, Cebul, and