Tiền xử lý dữ liệu

Một phần của tài liệu LUẬN văn THẠC sĩ NGHIÊN cứu ỨNG DỤNG học sâu CONVOLUTIONAL NEURAL NETWORK (CNN) TRONG NHẬN BIẾT THỜI kỳ TRÁI dứa CHÍN tại VÙNG TRỒNG dứa KHU vực MIỀN núi QUẢNG NAM – đà NẴNG (Trang 60 - 67)

KẾT QUẢ THỰC NGHIỆM

3.2.1. Tiền xử lý dữ liệu

Tập dữ liệu đầu vào

học tập tại trường. Hình ảnh được lấy từ các vườn trồng thơm trên địa bàn Quảng Nam – Đà Nẵng và tại một số tiểu thương tại các chợ trên địa bàn Đà Nẵng. Tập dữ liệu bao gồm 6000 ảnh trái thơm trong các giai đoạn chín. Tập dữ liệu hình ảnh được chia thành 3 nhóm thời kỳ chín của trái là: giai đoạn 1, giai đoạn 2 và giai đoạn 3. Tập dữ liệu được chia thành 2 phần tập đào tạo hay còn gọi là tập train. Đây là tập dữ liệu dùng cho máy học trích xuất những đặc điểm quan trọng có trong hình ảnh. Tập kiểm thử hay còn gọi là tập test là tập dữ liệu dùng để kiểm chứng độ chính xác sau khi mơ huấn luyện đào tạo có đáp ứng được u cầu hay không. Khác với tập train, tập test chỉ có dữ liệu đầu vào mà khơng có dữ liệu đầu ra. Máy tính sẽ nhận dữ liệu đầu vào, xử lý dữ liệu này và đưa ra kết quả tương ứng với giá trị đầu vào.

Hình 3.3: Vùng trồng dứa tại xã Đại Hồng – Huyện Đại Lộc

Xã Đại Hồng có 419 ha đất trồng dứa mỗi ha cho thu hoạch khoảng 11 tấn/vụ, người dân xã Đại Hồng hầu hết đều có đất trồng dứa. Cách đây khoảng 5 năm về trước, cây dứa được mùa được giá, nhiều hộ đã phất lên nhờ trồng dứa, xây nhà cửa, mua xe cộ, cho con cái đi học tất cả đều nhờ vào cây dứa.

Hình 3.4: Các quả dứa thu hoạch từ trang trại trồng dứa tại xã Đại Hồng - Huyện Đại Lộc

Hình 3.5: Dữ liệu trái thơm được thu thập

Gán nhãn dữ liệu

Gán nhãn dữ liệu là giai đoạn quan trọng nhất trong q trình huấn luyện có đạt được độ chính xác hay khơng. Sau khi thu thập tập dữ liệu đầu vào, nhóm nghiên cứu tiến hành gán nhãn cho từng ảnh để trích xuất được những vùng đặc trưng của trái thơm trong hình ảnh. Việc gán nhãn được thực hiện bằng phần mềm LabelImg. LabelImg là một cơng cụ để chú thích hình ảnh được viết bằng phần mềm Python và sử dụng Qt làm giao diện chính. Các bước thực hiện được trình bày bên dưới:

• Thực hiện việc cài đặt các thơng số bắt buộc của công cụ LabelImg. LabelImg được sử dụng rộng rãi và đa dạng các phiên bản python và hệ điều hành như Windows, Linux, Ubuntu. Với những hệ thống khác nhau có cách cài đặt khác nhau. Trong nghiên cứu này, nhóm thực hiện chạy cơng cụ LabelImg trên Windows và phiên bản python 3.x.

Hình 3.6: Figure 2 Cài đặt thơng số và thư viện pipenv

Hình 3.7: Cài đặt thư viện qt5py3

• Tải cơng cụ LabelImg trên github bằng lệnh terminal.

Hình 3.8: Cài đặt cơng cụ LabelImg từ github

• Sau khi đã có được mơi trường và các điều kiện bắt buộc, khởi động cơng cụ LabelImg bằng câu lệnh trên terminal.

Hình 3.10: Giao diện chính của LabelImg

• Open Dir để mở thư mục chứa hình ảnh trái thơm để đưa vào cơng cụ LabelImg. Hình ảnh trái thơm được định dạng đi .jpg.

Hình 3.11: Mở mục chưa hình ảnh trái thơm để bắt đầu gán nhãn

• Change Save Dir dùng để cập nhập lại đường dẫn chứa các nhãn gán sau khi thực hiện việc gán nhãn. Các tệp nhãn gán sẽ được lưu cùng tên với hình ảnh xử lý.

Hình 3.12: Chọn đường dẫn tới vị trí lưu trữ tệp thơng số gán nhãn

• Trong phần chức năng định dạng tệp gán nhãn. Chuyển sang định dạng YOLO phù hợp với đề tài nhóm đang báo cáo. Định dạng YOLO cho phép tệp xuất ra có dạng đi .txt.

Hình 3.13: Chọn định dạng YOLO cho mơ hình

• Sử dụng Create RectBox để bắt đầu kéo thả vùng chọn. Vùng chọn được chọn là vùng chưa hình ảnh đặc trưng của trái thơm bao gồm phần thân và phần ngọn.

Hình 3.14: Thực hiện q trình chọn vùng đặc trưng trái thơm

• Khi chọn được vùng đặc trưng của trái thơm sẽ tiến hành đánh nhãn cho vùng vừa chọn được. Trong đề tài này, nhóm sử dụng nhãn “Pineapple”.

Hình 3.15: Cập nhập thêm nhãn cho vùng đặc trưng vừa chọn

• Tệp sau khi được định dạng có những thơng tin như bên dưới sau đây: o MVI_7230000 là tên hình ảnh chọn đặc trưng.

o “0” là mã định dạng cho class đầu tiên

Hình 3.16: Thơng số đặc trưng của hình ảnh sau khi được lưu 3.3. HUẤN LUYỆN MƠ HÌNH

Một phần của tài liệu LUẬN văn THẠC sĩ NGHIÊN cứu ỨNG DỤNG học sâu CONVOLUTIONAL NEURAL NETWORK (CNN) TRONG NHẬN BIẾT THỜI kỳ TRÁI dứa CHÍN tại VÙNG TRỒNG dứa KHU vực MIỀN núi QUẢNG NAM – đà NẴNG (Trang 60 - 67)

Tải bản đầy đủ (DOCX)

(81 trang)
w