Từ trước đến nay, tự động đánh giá phẩm chất và khống chế phản hồi luôn luôn là vấn đề quan trọng khó mà thực hiện trong việc tự động hóa hoàn toàn chế biến nông sản phẩm. Cùng với sự phát triển của kỹ thuật xử lý ảnh, con người đã bắt đầu tìm cách ứng dụng kỹ thuật xử lý ảnh trong tự động hóa chế biến nông sản phẩm.
McConnell và Blau (1995) nghiên cứu sử dụng kỹ thuật xử lý ảnh, tiến hành đo sắc độ màu sắc của sản phẩm, căn cứ vào đó để điều khiển quá trình sấy và nướng thực phẩm đảm bảo chất lượng, đạt hiệu quả cao.
1.4. Yêu cầu thiết kế mô hình
Trong quá trình tìm hiểu và nghiên cứu em đã chọn thiết kế robot phát hiện sâu bệnh bằng phương pháp nhận dạng đối tượng trong thị giác máy tính. Với các yêu cầu:
- Chức năng nhận dạng sâu bệnh trên cây rau cải. Có thể di chuyển linh hoạt
- Chụp được ảnh, lưu chữ, truy xuất dữ liệu đơn giản
- Yêu cầu robot có kích thước dài, rộng, cao lần lượt là 25cm, 15cm, 20cm - Khung robot phải được thiết kế chắc chắn tránh rủi ro khi va chạm. - Làm việc ổn định trong các điều kiện ánh sáng khác nhau và sai số nằm ở
ngưỡng cho phép.
- Giao diện điều khiển bằng điện thoại, chạy ổn định.
Như vậy, qua chương 1 chúng ta đã hiểu rõ được kỹ thuật nhận dạng đối tượng trong thị giác máy tính, một vài ứng dụng của thị giác máy tính trong đời sống nói chung,công nghiệp, nông nghiệp nói riêng. Từ những cơ sở trên chúng ta có thể kết hợp để xây dựng được yêu cầu thiết kế robot phát hiện sâu bệnh bằng phương pháp nhận dạng đối tượng trong thị giác máy tính.
Tiếp theo để hiểu rõ hơn về đề tài, ta sẽ đi đến nội dung và phương pháp nghiên cứu được trình bày cụ thể trong chương 2.
CHƯƠNG II: NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU2.1. Đối tượng nghiên cứu 2.1. Đối tượng nghiên cứu
2.1.1. Phương pháp nhận dạng đối tượnga. Đặc trưng Haar-like a. Đặc trưng Haar-like
Các đặc trưng Haar-Like (P.-A. Viola và M-J. Jones, 2001) là những hình[]
chữ nhật được phân thành các vùng khác nhau như biểu diễn trong hình:
Hình 2.1. Các đặc trưng Haar-Like
Đặc trưng do Viola và Jones công bố gồm 4 đặc trưng cơ bản. Mỗi đặc trưng Haar-Like là sự kết hợp của hai hay ba hình chữ nhật trắng hay đen như hình sau:
Hình 2.2. Bốn đặc trưng cơ bản Haar-Like
Để sử dụng đặc trừng này vào việc nhận dạng đối tượng, 4 đặc trưng Haar-Like cơ bản được mở rộng ra và được chia làm 4 tập đặc trưng như sau:
Hình 2.3. Bốn tập đặc trưng Haar-Like
Giá trị của đặc trưng Haar-like được xác định bởi độ chênh lệch giữa tổng giá trị pixel mức xám nằm trong vùng “đen” so với vùng “trắng”:
f(x)=Tổng vùng đen ( pixel) – Tổng vùng trắng (pixel)
Vậy khi được đặt lên một vùng ảnh, đặc trưng Haar-Like sẽ tính toán và đưa ra giá trị đặc trưng h(x) của vùng ảnh đó.
Để phát hiện đối tượng, hệ thống sẽ cho một cửa sổ con (sub-window) có kích thước cố định quét lên toàn bộ ảnh đầu vào. Như vậy sẽ có rất nhiều ảnh con ứng với từng cửa sổ con, các đặc trưng Haar-Like sẽ được đặt lên các cửa sổ con này để từ đó tính ra giá trị của đặc trưng. Sau đó các giá trị này được bộ phân loại xác nhận xem khung hình đó có phải đối tượng hay không.
Hình dưới là một ví dụ: khung màu xanh là cửa sổ con, một đặc trưng Haar-Like với kích thước và vị trí đặt như trong hình
Ứng với mỗi đặc trưng như trên, một bộ phân lớp yếu (weak classifier) hk(x) được định nghĩa như sau:
(x) = Trong đó:
X: cửa sổ con cần xét θk : ngưỡng
fk: giá trị của đặc trưng Haar-Like
pk: hệ số quyết định chiều của bất phương trình
Ta hiểu công thức trên đơn giản như sau: khi giá trị của đặc trưng Haar- like f tại cửa sổ con x vượt qua một ngưỡng thì bộ phân lớp h (x) sẽ kết luậnk k
cửa sổ con x là đối tượng h (x)=1, còn f không vượt qua ngưỡng đó thì không làk k
đối tượng.
Ngưỡng là giá trị đã rút ra sau quá trình huấn luyện bộ phân lớp.
Như trong phần đối tượng nhận dạng, ta thấy đặc trưng Haar-like có kích thước và vị trí đặt trong cửa sổ con x trên hình sẽ có giá trị f rất lớn (vì mứck
xám ở các vùng là khác nhau. Giá trị f này lớn hơn nhiều với hầu hết các giá trịk
fk khác khi ta di chuyển cửa sổ con x sang các vị trí khác (quét trên toàn ảnh đầu vào), và với nhưỡng phù hợp, kết quả bộ phân lớp h (x) sẽ cho cửa sổ con ở vịk
trí như trên là đối tượng còn ở vị trí khác thì không.
Đương nhiên sẽ có những vị trí khác trên ảnh đầu vào vô tình cho ra fk
vượt ngưỡng và bộ phân lớp yếu h (x) kết luận đấy là đối tượng, nhưng ta khôngk
chỉ dùng một đặc trưng Haar-like mà dùng rất nhiều đặc trưng ở những vị trí và kích thước khác nhau trong cửa sổ con làm giảm đi sự trùng hợp ngẫu nhiên.
Việc xác định một cửa sổ con có phải là đối tượng hay không phải sử dụng rất nhiều đặc trưng Haar-like. Ứng với mỗi một kích thước, kiểu đặc trưng và vị trí đặt trong cửa sổ con cho ta một đặc trưng ứng với một bộ phân lớp yếu
x. Vì vậy tập hợp đầy đủ số lượng các đặc trưng trong một cửa sổ con là rất lớn. Theo như sự tính toán của hai tác giả, với một cửa sổ con ở kích thước cơ bản
2424 pixel số lượng đầy đủ các đặc trưng Haar-like là hơn 160000. Có hai vấn đề đặt ra ở đây:
Thứ nhất là giá trị của mỗi một đặc trưng Haar-like được tính bằng tổng giá trị các điểm ảnh vùng đen trừ đi tổng các điểm ảnh vùng trắng, như vậy là với số lượng lớn các đặc trưng sẽ tạo ra một khối lượng tính toán khổng lồ. Điều này là không phù hợp để đáp ứng thời gian thực vì thời gian xử lý rất lâu.
Thứ hai là trong số hàng trăm nghìn đặc trưng đó thì không phải đặc trưng nào cũng có ích cho công việc phân loại. Nếu chúng ta không tìm cách loại bổ những đặc trưng không có ích để tập trung vào những đặc trưng có hiệu quả cao thì cũng sẽ mất thời gian xử lý một cách vô ích.