Nhận dạng và xác định vị trí cỏ dại trên luống hoa màu dùng máy véc tơ hỗ trợ và mạng nơ ron

Nông nghiệp công nghệ cao ứng dụng hệ thần kinh nhân tạo cũng theo xu thế đó, đây là hệ thống sản xuất nhằm đáp ứng chính xác yêu cầu của cây trồng, ngăn việc sử dụng phân bón hữu cơ, phân bón hóa học, thuốc diệt cỏ một cách lãng phí, qua đó không những góp phần bảo vệ môi trường, tiết kiệm được sức lao động của con người mà còn làm tăng năng suất của cây trồng.

Trang 1

ĐẠI HỌC SÀI GÒN OF SAIGON UNIVERSITY

Email: tcdhsg@sgu.edu.vn ; Website: https://tapchikhoahoc.sgu.edu.vn

NHẬN DẠNG VÀ XÁC ĐỊNH VỊ TRÍ CỎ DẠI TRÊN LUỐNG HOA MÀU DÙNG MÁY VÉC TƠ HỖ TRỢ VÀ MẠNG NƠ-RON

Weed detection in vegetable garden using support-vector

machine and neural networks

TS Nguyễn Tất Bảo Thiện(1), Nguyễn Thị Cẩm Tú(2)

(1) Học viện Công nghệ Bưu chính Viễn thông, Cơ sở tại TP.HCM

(2) Trường Đại học Công nghệ Thông tin – ĐHQG TP.HCM

TÓM TẮT

Ngày nay, trí tuệ nhân tạo được ứng dụng trong hầu hết trên mọi lĩnh vực Nông nghiệp công nghệ cao ứng dụng hệ thần kinh nhân tạo cũng theo xu thế đó, đây là hệ thống sản xuất nhằm đáp ứng chính xác yêu cầu của cây trồng, ngăn việc sử dụng phân bón hữu cơ, phân bón hóa học, thuốc diệt cỏ một cách lãng phí, qua đó không những góp phần bảo vệ môi trường, tiết kiệm được sức lao động của con người

mà còn làm tăng năng suất của cây trồng Trong nghiên cứu này, các mô hình máy học như vectơ hỗ trợ

và mạng nơ-ron được ứng dụng nhằm huấn luyện, nhận dạng và phân loại đồng thời định vị cỏ dại trên ảnh màu Kết quả của quá trình phân loại và định vị cỏ dại sẽ được dùng làm thông tin đầu vào cho thiết

bị điều khiển phun thuốc diệt cỏ phù hợp cho từng loại cỏ mà không gây ảnh hưởng đến cây trồng

Từ khóa: máy học, mạng nơ-ron nhiều lớp, nông nghiệp công nghệ cao, nhận dạng lá cây,

support-vector machine - SVM

ABSTRACT

Nowadays, artificial intelligence is present in almost every fields Precision agriculture is following the trend, which is a production system that accurately meets the requirements of plants and prevents excessive use of organic fertilizers, chemical fertilizers or herbicides Thereby, it does not only contribute to protect the environment and save the human labor but also increase the crop productivity

In this study, the machine learning models i.e support vector machine and neural networks were applied

to identify, classify weeds and locate its positions on color images The results of the identification process could be used as the input information for the potential automatic equipment to suitably spray herbicides for each type of grasses without affecting the crop

Keywords: machine learning, multi-layer perceptron, precision agriculture, object recognization,

support vector machine

1 Đặt vấn đề

Để hạn chế tình trạng phun thuốc diệt

cỏ một cách tràn lan, thiếu chính xác,

không hiệu quả và có thể gây tác hại cho

môi trường cần phải xây dựng được một hệ

thống phân biệt đâu là cỏ dại, đâu là cây

trồng và phải xác định được vị trí của cỏ dại nhằm làm dữ liệu cho hệ thống tự động phun thuốc diệt cỏ hoặc hệ thống bón phân

tự động tại vị trí cây trồng

Đến thời điểm hiện tại, đã có một số sản phẩm nghiên cứu có thể nhận dạng và

Trang 2

cho biết định danh của một số loại cỏ dại

thường gặp, hoặc ở mức độ cao hơn là xác

định được vị trí của cây trồng, chẳng hạn,

một nghiên cứu được thực hiện vào năm

2013, [2], bằng việc phát triển hệ thống thị

giác máy tính, hệ thống đã xác định được

vị trí của cây trồng, tính toán được vùng là

che phủ để thẩm định chất lượng cây trồng

Một phương pháp nghiên cứu khác

cũng được đánh giá cao đó là phương pháp

Chain code Phương pháp này sử dụng kỹ

thuật Computer-Aided Plant Species

Identification Technique (CAPSI) để đối

sánh hình dạng của lá [8] Đầu tiên, ảnh

tiền xử lý được chuyển từ ảnh màu sang

ảnh xám Thao tác Sobel được áp dụng trên

ảnh nhị phân để xác định các cạnh trên ảnh

trước khi làm mỏng các cạnh Quá trình rút

trích các tính năng của lá gồm hình dạng,

kích thước, kết cấu và cách sắp xếp của lá

trên 1 cành dựa trên phương pháp Chain

code Cuối cùng là nhận dạng tính năng

của lá bằng cách áp dụng kỹ thuật so sánh

tuyến tính Tuy tỷ lệ nhận dạng cao nhưng

lại có một số khó khăn trong quá trình thực

hiện như độ sáng, độ nét của ảnh Do nhận

dạng cỏ dại dựa trên các đặc trưng của lá

nên có một số nghiên cứu gặp khó khăn

trong trường hợp các lá xếp chồng lên

nhau

Trên thế giới đã có rất nhiều tài liệu

nghiên cứu về vấn đề “Nông nghiệp công

nghệ cao” Mỗi tài liệu trình bày một khía

cạnh khác nhau của vấn đề Năm 2000, các

nhà nghiên cứu [1] đã phát triển hệ thống

mạng nơ-ron lan truyền ngược để nhận

dạng cỏ dại trong luống bắp non Một ảnh

kích thước 756x504 pixel được chụp trên

luống bắp, sau đó ảnh được cắt ra thành các

ảnh có kích thước 100x100 pixel sao cho

trên ảnh chỉ còn 1 đối tượng hoặc là cây

bắp non hoặc là cây cỏ dại Tập huấn luyện gồm 40 ảnh về cây bắp non, 40 ảnh vể cây

cỏ dại và 20 ảnh mẫu được dùng để kiểm tra Kết quả thực nghiệm cho thấy, ANN nhận dạng cây bắp non đạt đến tỷ lệ cao nhất 100% và cỏ dại là 80% Điều này chấp nhận được do lượng dữ liệu cho việc huấn luyện ANN là ít và do hạn chế của phần cứng máy tính trong thời gian đó

Việc nhận dạng lá tập trung vào 2 nhóm đặc trưng là vân lá và hình dạng lá với phương pháp Fast Fourier Transform (FFT) cũng đã được sử dụng và cho kết quả khá tốt [3] Có tất cả 21 đặc trưng của

lá được rút trích cho việc nhận dạng bao gồm 10 đặc trưng đầu tiên được rút trích dựa vào khoảng cách giữa đường viền và đường gân chính của lá, 10 đặc trưng tiếp theo được rút trích bằng cách sử dụng các hình thái kỹ thuật số với 4 dạng hình học

cơ bản, 5 dạng vân lá và 1 đặc trưng cuối cùng được rút trích bằng cách sử dụng kỹ thuật Convex hull Kết quả thực nghiệm của việc sử dụng 1907 ảnh lá cho 32 loại cây trồng cho thấy tỷ lệ nhận dạng trung bình 97.19%

Từ thực tế đó, chúng tôi đề xuất thực hiện đề tài “Nhận dạng và xác định vị trí cỏ dại lẫn trên luống hoa màu” Đề tài tuy chỉ dừng lại ở việc nhận dạng và xác định vị trí của cây cỏ dại nhưng đầu ra của hệ thống nhận dạng của chúng tôi sẽ là dữ liệu cho các hệ thống tự động với các hoạt động tiếp theo như phun thuốc diệt cỏ chính xác tại vị trí đã được xác định hoặc bón phân tại gốc cây trồng

2 Máy học véc tơ hỗ trợ và mạng nơ-ron nhân tạo

2.1 Máy học véc tơ hỗ trợ

SVM – Support Vectors Machine là một mô hình học có giám sát, trong lĩnh

Trang 3

vực máy học [6] SVM thường được sử

dụng để phân lớp dữ liệu (classification),

hoặc phân tích hồi quy (regression

annalysis) Ý tưởng chính của phương

pháp SVM là cho trước một tập huấn

luyện, được biểu diễn trong không gian

vector, trong đó mỗi mẫu là một điểm

Phương pháp này tìm ra một siêu phẳng

quyết định tốt nhất có thể chia các điểm

trên không gian này thành hai lớp riêng

biệt tương ứng là lớp (+) và lớp (-) Chất

lượng của siêu phẳng này được quyết định

bởi khoảng cách của điểm dữ liệu gần nhất

của mỗi lớp đến mặt phẳng này Khi đó,

khoảng cách biên càng lớn thì mặt phẳng

có chất lượng càng tốt, đồng thời việc phân

loại sẽ càng chính xác Kiến trúc phân loại

SVM được định nghĩa như sau:

f(x) = sign(wTx + b)

Trong đó sign(z) = +1 nếu z ≥ 0,

sign(z) = -1 nếu z < 0 Nếu f(x) = +1 thì x

thuộc về lớp dương (lĩnh vực được quan

tâm), và ngược lại, nếu f(x) = -1 thì x thuộc

về lớp âm (các lĩnh vực khác) Điều này

được minh họa trong Hình 1

Hình 1: Minh họa việc xác định siêu

phẳng phân chia 2 lớp đối tượng

2.2 Mạng nơ-ron nhân tạo

Khái niệm về mạng nơ-ron đã có từ

những năm 1950 với sự ra đời của ngành

nghiên cứu về trí tuệ nhân tạo [9] Khi các

hệ thống máy tính được kết nối lại với nhau, chúng có thể giải quyết những vấn đề khó khăn hơn Và quan trọng nhất, khi áp dụng đúng thuật toán, người ta có thể “dạy học” cho máy tính Về bản chất, “học” chính là quá trình hiệu chỉnh trọng số liên kết giữa các nơ-ron sao cho giá trị hàm lỗi

là nhỏ nhất Có ba phương pháp học phổ biến là học có giám sát, học không giám sát và học tăng cường

Đơn vị xử lý của mạng nơ-ron gọi là một nơ-ron hay một nút (node) thực hiện một công việc rất đơn giản; nó nhận tín hiệu vào từ các đơn vị phía trước hay một nguồn bên ngoài và sử dụng chúng để tính tín hiệu ra sẽ được lan truyền sang các đơn

vị khác

Hình 2: Minh họa dữ liệu đầu vào

và đầu ra của một nơ-ron Trong đó:

xi: các đầu vào

wji: các trọng số tương ứng các đầu vào

θj: độ lệch (bias)

aj: đầu vào mạng (net-input)

zj: đầu ra của nơ-ron g(x) : hàm chuyển (hàm kích hoạt) Kiến trúc mạng nơ-ron tích chập được

sử dụng vào năm 2012 được cộng đồng nghiên cứu gọi với tên gọi là AlexNet do tác giả chính của nhóm nghiên cứu là Alex Krizhevsky [5] Vào năm 2017, Nhóm SuperVision gồm các thành viên Alex Krizhevsky, Ilya Sutskever và Geoff

Trang 4

Hinton cùng mạng AlexNet của họ đã đạt

được kết quả đáng kinh ngạc với độ chính

xác chênh lệch đến hơn 10% (15,31% và

26,17%) [5] Điều đặc biệt là mạng huấn

luyện này chỉ nhận dữ liệu đầu vào là các

giá trị điểm ảnh thô và không hề áp dụng

bất kỳ phương pháp trích chọn đặc trưng

nào Thiết kế kiến trúc mạng huấn luyện

gần như một hộp đen với khả năng tự học

thông qua các lớp ẩn, đã khiến CNN nói

riêng cùng học sâu nói chung trở thành giải

pháp mạnh mẽ nhất cho bài toán nhận dạng

và phân loại Đó cũng chính là lý do, chúng

tôi chọn mạng huấn luyện AlexNet đảm

nhận vai trò nhận dạng loại cỏ có trong ảnh

đầu vào

3 Tập dữ liệu

Đối tượng hoa màu trong nghiên cứu

này là cây bắp non 2 - 3 tuần tuổi Chúng

tôi thu thập dữ liệu gồm có:

- 100 ảnh cây bắp non

- 100 ảnh cây cỏ mần trầu

- 100 ảnh cây cỏ rau sam

- 100 ảnh cây bắp có lẫn 1 hoặc 2 loại

cỏ trên

Việc thu thập dữ liệu ảnh được thực

hiện trên các thửa ruộng bắp ở miền Đông

Nam Bộ bằng camera điện thoại với ảnh ở

chế độ phân giải 3264x2448 Với mục đích

mô phỏng hệ thống và kiểm tra các giải

thuật nhận dạng, đầu tiên chúng tôi thu

thập và xử lý trên ảnh tĩnh Trong trường

hợp triển khai hệ thống thực tế, trên diện

tích lớn, chúng tôi dự định sẽ tiến hành lắp

đặt 1 dãy các camera trên 1 thanh ngang,

khoảng cách giữa 2 camera bằng khoảng

cách giữa 2 luống bắp, mỗi camera sẽ làm

nhiệm vụ quét 1 luống Thanh ngang này

sẽ tích hợp thêm đầu phun thuốc và được

gắn cố định vào robot; robot sẽ di chuyển

giữa 2 luống bắp

4 Mô hình nhận dạng và xác định vị trí cỏ dại trên luống hoa màu

Mô hình nhận dạng và định vị cỏ dại trên luống hoa màu được mô phỏng dựa trên sự kết hợp của Máy học véc tơ hỗ trợ

và Mạng nơ-ron nhân tạo (Hình 3)

- Dữ liệu đầu vào là tập ảnh màu có độ phân giải 3264x2448

- Dữ liệu đầu ra là kết quả nhận dạng loại cỏ và vị trí của các cây cỏ có trên ảnh

Hình 3: Mô hình phân loại và xác định vị

trí cỏ dại trên luống hoa màu

- Thế mạnh của SVM là một thuật toán phân loại nhị phân [9], rất thích hợp cho việc phân lớp bước đầu để biết ảnh đưa vào

là ảnh có cỏ dại hay không

- Đối với mạng nơ-ron nhân tạo, sau khi được huấn luyện bằng phương pháp học có giám sát với tập đặc trưng về lá của nhiều loại cỏ dại khác nhau, việc nhận dạng loại cỏ dại sẽ đạt hiệu quả cao hơn

- Việc kết hợp SVM và mạng nơ-ron nhân tạo làm cho hệ thống đạt hiệu quả cao, góp phần giúp cho sản xuất nông nghiệp tiến đến gần khái niệm “nông nghiệp công nghệ cao”

4.1 Tiền xử lý ảnh

Quá trình tiền xử lý ảnh nhằm mục

Trang 5

đích rút trích các đặc trưng của các đối

tượng được thực hiện qua các bước sau:

- Hiệu chỉnh kích thước: ảnh được

hiệu chỉnh về kích thước 1306x980

Hình 4: Ảnh cây bắp non trước và sau khi

hiệu chỉnh kích thước

- Sau khi tách các kênh màu trên ảnh,

chúng tôi chuyển ảnh màu thành ảnh nhị

phân với ngưỡng Ostu [11], [12]

Hình 5: Ảnh cây bắp sau khi phân đoạn

ảnh dựa trên ngưỡng Ostu

- Dùng thuật toán mở, xóa nền của ảnh

và loại bỏ các đối tượng cắt biên ảnh nhằm

thu được trọn vẹn đối tượng cần xét Thực

hiện xóa nhiễu trên ảnh bằng cách loại bỏ

các đối tượng ảnh có diện tích nhỏ hơn 1

ngưỡng diện tích xác định

Hình 6: Ảnh sau khi đã loại bỏ nhiễu và

các đối tượng cắt biên ảnh

- Dùng hàm imfill để làm “mịn” đối tượng trong ảnh bằng cách tô trắng các

“holes” có trên đối tượng nhằm hỗ trợ cho việc nhận dạng đối tượng

Hình 7: Ảnh nhị phân sau khi làm “mịn”

4.2 Rút trích đặc trưng

Để đạt được tỷ lệ nhận dạng chính xác cao thì bước quan trọng nhất là rút trích đặc trưng và đây là kỹ thuật sử dụng các thuật toán để lấy ra những thông tin mang những đặc điểm riêng biệt của đối tượng có trong ảnh

Để xây dựng tập đặc trưng huấn luyện cho kiến trúc SVM, chúng tôi sử dụng kỹ thuật SURF (Speed Up Robust Feature)

Trang 6

[7], sau đó sử dụng kỹ thuật

K-Mean [4] để phân nhóm đối tượng có

trong ảnh

Đối với mạng AlexNet, tập đặc trưng

để huấn luyện cho mạng này được xây

dựng trực tiếp một cách tự động dựa trên

ảnh màu

4.3 Kiến trúc SVM - Support Vector Machine

Vì SVM là một mô hình học có giám sát nên ta cần xây phân loại ảnh đầu vào thành 2 nhóm cơ bản: nhóm 1: ảnh là cây bắp non; nhóm 2: ảnh là cây cỏ và ảnh là

cây bắp non lẫn cỏ

Bảng 1: Phân loại dữ liệu thành 2 nhóm

Việc rút trích đặc trưng trên một ảnh

xám được thực hiện dựa trên thuật toán

SURF Chúng tôi xây dựng tập đặc trưng

cho 1 đối tượng trên ảnh Với tập dữ liệu

thu được, chúng tôi sử dụng thuật toán

K-Mean để gom nhóm phân loại đối tượng

trong ảnh

Khi một ảnh màu được đưa vào, ảnh sẽ

được tiền xử lý để thu được ảnh nhị phân

để chuyển vào kiến trúc SVM Tại đây ảnh

được phân loại: nếu là cây bắp thì hệ thống

sẽ xuất ra thông báo; ngược lại ảnh sẽ được

chuyển sang kiến trúc AlexNet

4.4 Kiến trúc mạng AlexNet

AlexNet bao gồm 5 lớp tích chập và 3

lớp kết nối đầy đủ:

- Lớp 1 (Tích chập):

 Đầu vào: Ảnh với kích thước 224 x

224 x 3 (3 là con số tương ứng với 3 màu

đỏ, xanh lục, xanh lam trong hệ màu RGB

thông thường)

 Số bộ lọc: 96

 Kích thước bộ lọc: 11 x 11 x 3

 Bước trượt (Stride): 4

 Đầu ra: (224/4) x (224/4) x 96 = 55

x 55 x 96, chia đều cho hai GPU

 Lớp chuyển tiếp sang lớp 2 (Lấy mẫu tối đa)

 Đầu vào: 55 x 55 x 96

 Đầu ra: (55/2) x (55/2) x 96 = 27 x

27 x 96

- Lớp 2 (Tích chập):

 Đầu vào: 27 x 27 x 96

 Số bộ lọc: 256

 Kích thước bộ lọc: 5 x 5 x 48

 Đầu ra: 27 x 27 x 256, chia đều cho hai GPU

- Lớp 3, 4, 5:

Tương tự như với lớp 1 và lớp 2 với các kích thước bộ lọc lần lượt là 3 x 3 x

256, 3 x 3 x 384 và 3 x 3 x 384 Toàn bộ các lớp tính toán này đều được chia đều cho hai

Trang 7

GPU để tăng tốc độ xử lý Đầu ra cuối cùng

qua lớp Tích chập thứ 5 là dữ liệu với kích

thước 13 x 13 x 128, dữ liệu này sau khi đi

qua một lớp lấy mẫu cuối cùng sẽ được

dùng làm đầu vào cho các lớp sau đó là các

lớp Kết nối đầy đủ

- Lớp 6 (Kết nối đầy đủ):

 Đầu vào: 6 x 6 x 256

 Số nơ-rôn: 4096

- Lớp 7 (Kết nối đầy đủ): tương tự lớp

6

- Lớp 8 (Kết nối đầy đủ): là lớp cuối

cùng trong mạng AlexNet này có 1000 nơron, tương ứng với 1000 lớp khác nhau

mà bộ huấn luyện cần nhận dạng

Hình 8: Mô phỏng cấu trúc mạng AlexNet [13]

Mỗi lớp tích chập đều có Feature Map,

ReLU, LRN (Local Response Normalized)

và Overlap max pooling

Với tập ảnh gồm 3 thư mục con (cây

bắp non lẫn cỏ, cỏ rau sam và cỏ mần trầu),

với số ảnh màu trong mỗi thư mục là tùy ý,

ở đây, chúng tôi sử dụng:

- Thư mục cây bắp non lẫn cỏ: 37 ảnh

- Thư mục Cỏ mần trầu: 55 ảnh

- Thư mục Cỏ rau sam: 93 ảnh

Mạng huấn luyện AlexNet sẽ chia

ngẫu nhiên thành 2 tập: ở đây, chúng tôi

chọn ngẫu nhiên 70% số ảnh cho tập huấn

luyện và 30% số ảnh cho tập

đánh giá

Với mô hình AlexNet, ảnh màu được

chuẩn hóa kích thước 227x227x3 trước khi

đưa vào mạng AlexNet Sau khi đi qua các

lớp tích chập, mỗi ảnh màu sẽ được trích ra

4096 đặc trưng làm đầu vào cho lớp kết nối

đầy đủ đầu tiên

Dựa vào kết quả đánh giá sau khi huấn luyện trên tập ảnh thu thập được, chúng tôi nhận được tỷ lệ nhận dạng cao Mặc dù, mỗi lần hệ thống thực thi thì số ảnh được chọn làm tập huấn luyện và tập đánh giá là ngẫu nhiên nhưng tỷ lệ chính xác chúng tôi thu được luôn cao hơn 90%

5 Kết quả thực nghiệm

Hệ thống thực nghiệm được mô phỏng trong môi trường Matlab 2018a

Ảnh sau khi được tiền xử lý sẽ được rút trích đặc trưng và tiến hành so sánh với các đặc trưng có trong tập huấn luyện của SVM để đưa ra kết quả là ảnh của bắp hay không

- Nếu là ảnh của bắp sẽ xuất ra thông báo

- Nếu không, ảnh sẽ được sử dụng lại tên để tìm lại ảnh gốc ban đầu và chuyển sang mạng AlexNet để phân loại Mạng AlexNet phân loại chính xác các đối tượng

Trang 8

có trong ảnh sau đó chuyển đối tượng ảnh

vào đúng khung phân loại nếu trên ảnh là 1

trong 2 loại cỏ trên hoặc ảnh có cả bắp lẫn

cỏ Đối với trường hợp trong ảnh có cả bắp

lẫn cỏ thì chúng tôi cũng gán nhãn chính

xác được cho các đối tượng có trong ảnh

- Với tập ảnh gồm 35 ảnh nhị phân là

cây bắp non và 35 ảnh nhị phân gồm có

ảnh của 2 loại cỏ và ảnh có cả bắp lẫn cỏ

Để huấn luyện cho SVM, trong bài toán

này, chúng tôi chọn ra ngẫu nhiên 40% ảnh

trong mỗi tập và 60% ảnh còn lại để đánh

giá Việc rút trích đặc trưng dựa trên thuật

toán SURF và trích ra 20 đặc trưng mạnh

nhất có trên mỗi ảnh để huấn luyện Sau

đó, thuật toán gom nhóm K-Mean có vai

trò trả về kết quả ảnh đầu ra là bắp hoặc

không Trên cùng một tập huấn luyện

nhưng mỗi lần thực thi hệ thống chọn ra

một tập ảnh ngẫu nhiên nên độ chính xác

của thuật toán luôn biến động, song qua

nhiều lần thực thi chúng tôi nhận được kết

quả nhận dạng của kiến trúc SVM là đáng

tin cậy trên 80%

Với mạng AlexNet, chúng tôi có 3 loại

nhãn để lựa chọn gán cho 1 ảnh: 1, ảnh cỏ

mần trầu; 2, ảnh cỏ rau sam; 3, ảnh có cả

bắp lẫn cỏ Ảnh để huấn luyện cho mạng

AlexNet là ảnh màu chưa qua bất kỳ giai

đoạn tiền xử lý nào Các kết quả có thể thu

được khi có 1 ảnh đưa vào kiểm tra:

Nếu ảnh đầu vào là bắp: xuất ra thông

báo:

Hình 9: Thông báo của hệ thống nếu ảnh

chỉ có cây bắp

Nếu ảnh đầu vào là 1 trong 2 loại cỏ:

Hình 10: Thông báo của hệ thống nếu ảnh

chỉ có cây cỏ mần trầu Nếu ảnh đầu vào là ảnh có cả cỏ lẫn bắp: ảnh sẽ được phân vùng các đối tượng

và tiến hành gán nhãn cho từng đối tượng sau khi được tách ra riêng biệt

Hình 11: Ảnh được phân vùng các đối

tượng trên ảnh Các đối tượng trong ảnh ở trường hợp

có cả bắp lẫn cỏ sau khi phân vùng sẽ được cắt thành các đối tượng riêng biệt và một lần nữa đưa vào AlexNet để được gán nhãn:

Hình 12: Các đối tượng riêng biệt đã được

gán nhãn

Trang 9

6 Kết luận và hướng nghiên cứu

tiếp theo

Với tập ảnh thu thập được, sau tiền xử

lý tập ảnh để xây dựng tập đặc trưng huấn

luyện cho SVM, chúng tôi có được kết quả

nhận dạng với tỷ lệ chính xác chấp nhận

được:

Hình 13: Kết quả tỷ lệ nhận dạng chính

xác của kiến trúc SVM

Hình 14: Tiến trình huấn luyện và tỷ lệ chính xác của mạng AlexNet

Đối với ảnh chỉ có 1 loại cỏ, hệ thống

đã nhận dạng đúng và xác định được vị trí

của cỏ trên ảnh Riêng với ảnh có cả bắp

lẫn cỏ trong trường hợp không chồng lắp

thì hệ thống đã tách ra và gán nhãn đúng

cho các đối tượng có trong ảnh nhưng vẫn

chưa xác định vị trí của cỏ có trong ảnh

Riêng trường hợp ảnh có bắp lẫn cỏ

dại bị chồng lắp lên nhau việc cắt rời các

đối tượng gặp lỗi nên dẫn đến việc gán

nhãn cũng không thực hiện được

Hướng nghiên cứu sắp tới:

- Xử lý tốt trường hợp ảnh có bắp và

cỏ chồng lắp lên nhau

- Xác định được vị trí của các đối tượng trong trường hợp trên ảnh có cả bắp lẫn cỏ

- Xây dựng hệ thống tự động phun thuốc diệt cỏ dựa và xử lý vấn đề thời

gian thực

LỜI CẢM ƠN

Chúng tôi xin chân thành cám ơn Học Viện Công Nghệ Bưu Chính Viễn Thông và Trường Đại Học Công Nghệ Thông Tin tạo điều kiện cho chúng tôi hoàn thành bài báo này

Trang 10

TÀI LIỆU THAM KHẢO

[1] C.-C Yang, S.O Prasher, J.-A Landry, H.S Ramaswamy, A Ditommaso,

“Application of artificial neural networks in image recognition and classification of crop

and weeds”, Canadian Agricultural Engineering, Vol 42., No.3, pp 147-152, 2000 [2] Michael Weyrich, Yongheng Wang, Matthias Scharf, “Quality assessment of row Crop plants by using a machine vision system”, IECON 2013 - 39th Annual Conference of the IEEE Industrial Electronics Society, pp 2466-2471, 2013

[3] Kue-Bum Lee and Kwang-Seok Hong, “An Implementation of Leaf Recognition

System using Leaf Vein And Shape”, International Journal of Science and Bio-Technology, Vol 5, No 2, April 2013

[4] Oyelade, O J, Oladipupo, O O, Obagbuwa, I C, “Application of k-Means Clustering

algorithm for prediction of Students’ Academic Performance”, International Journal

of Computer Science and Information Security, Vol 7, No.1, 2010

[5] Alex Krizhevsky, Ilya Sutskever, Geoffrey E Hinton, “ImageNet classification with deep

convolutional neural networks”, Communications of the ACM, Vol.60, No.6, June 2017

[6] Chih-Wei Hsu, Chih-Chung Chang, and Chih-Jen Lin, “A Practical Guide to Support

Vector Classification”, Technical report, Department of Computer Science, National

Taiwan University July, 2003

[7] Herbert Bay, Tinne Tuytelaars, and Luc Van Gool1, “SURF: Speeded Up Robust

Features”, Computer Vision – ECCV 2006: 9th European Conference on Computer Vision, Graz, Austria, May 7-13, 2006 Proceedings, Part I (pp.404-417)

[8] Miss Pande Ankita V , Prof Shandilya V.K, “Digital Image Processing Approach for

Fruit and Flower Leaf Identification and Recognition”, International Journal Of Engineering And Computer Science, Vol 2, No 4, pp 1280-1285, 2013

[9] Awad M., Khanna R, “Support Vector Machines for Classification”, Efficient Learning Machines, pp 39-66, 2015, Apress, Berkeley, CA

[10] “A Comprehensive Study of Artificial Neural Networks”, International Journal of Advanced Research in Computer Science and Software Engineering, Vol 2, No 10,

pp.278-284, 2012

[11] Hongzhi Wang, Ying Dong “An Improved Ostu Method for Image Segmentation”,

Proceedings of SPIE - The International Society for Optical Engineering, Beijing,

March 2008

[12] Ostu N., “A threshold selection method from gray-level histogram”, IEEE Transaction on Systems, Man, and Cybernetics, Vol 9, No 1, pp 62-66, 1979

[13] Rakshith Vasudev (2019, Feb) [Online] HYPERLINK https://towardsdatascience.com/ understanding-and-calculating-the-number-of-parameters-in-convolution-neural-networks -cnns-fc88790d530d

Ngày nhận bài: 07/4/2019 Biên tập xong: 15/5/2019 Duyệt đăng: 20/5/2019

Định dạng
Số trang	10
Dung lượng	1,19 MB