Thực nghiệm mô hình với đối tượng di động

Một phần của tài liệu Đề tài nghiên cứu ứng dụng thuật toán mạng nơ ron tích chập nhận dạng các đối tượng di động (Trang 73 - 77)

5. Nội dung nghiên cứu

3.4.2. Thực nghiệm mô hình với đối tượng di động

Với đối tượng tĩnh tác giả đã thực hiện ở Mục 3.4.1 trên. Sự khác biệt giữa đối tượng tĩnh và di động được hiểu như sau:

- Đối tượng tĩnh (hay là ảnh tĩnh) là đối tượng luôn luôn cố định vị trí của mình theo thời gian (hay cố định nội dung trên ảnh).

- Đối tượng di động là đối tượng luôn thay đổi vị trí của mình theo thời gian (hay ảnh động là sự kết hợp xâu chuỗi của nhiều ảnh tĩnh trong một thời gian ngắn). Như vậy, đối tượng di động mà tác giả đưa vào cho mô hình thực nghiệm là một video có tốc độ chụp từ 25 đến 30 hình ảnh trong một giây, các hình ảnh này được ghép xâu chuỗi liên tục.

3.4.2.1. Thực nghiệm trên loài hoa di động

Đối tượng di động được tác giả lấy từ nguồn video quay các đối tượng loài hoa di động. Nguồn video được lấy từ trên mạng internet để đưa vào cho mô hình nhận dạng, video được quay bởi Flycam hoặc con người.

Để thực nghiệm tác giả tải đoạn video loài hoa cẩm tú cầu di động tại địa chỉ (https://www.youtube.com/watch?v=uYXfkVMZQCM), hình ảnh loài hoa cẩm tú cầu trong video được tác giả chụp lại và thể hiện như Hình 3.22. Sau khi đưa vào mô hình nhận dạng tác giả sử dụng phần mềm Bandicam quay video quá trình nhận dạng đối tượng loài hoa cẩm tú cầu di động, hình ảnh nhận dạng từ video được tác giả chụp lại như Hình 3.23

59 Hình 3.22: Nguồn video hoa cẩm tú cầu di động

Hình 3.23: Kết quả nhận dạng hoa cẩm tú cầu bởi mô hình

Tại Hình 3.23 ta thấy, kết quả nhận các loài hoa được gán tên Hydrangeas (hoa cẩm tú cầu), trong hình ảnh có rất nhiều bông hoa cẩm tú cầu nhưng mô hình chỉ nhận

60 dạng được tám bông hoa, đây cũng là hạn chế của nghiên cứu này vì một số bông hoa có khoảng các chụp xa hoặc bị nhiễu thì mô hình không nhận dạng được.

3.4.2.2. Thực nghiệm trên một số đối tượng di động con người, xe ô tô, xe máy

Video đưa vào thực nghiệm được tác giả tải từ nguồn Youtube tại địa chỉ (https://www.youtube.com/watch?v=hmtqseDQ1cM), hình ảnh các đối tượng trong video được thể hiện như Hình 3.24. Tương tự, sau khi đưa vào mô hình nhận dạng tác giả sử dụng phần mềm Bandicam quay video quá trình nhận dạng đối tượng di động, hình ảnh nhận dạng từ video được tác giả chụp lại như Hình 3.25.

61 Hình 3.25: Kết quả nhận dạng người, xe di động bởi mô hình

Tại Hình 3.25 cho thấy mô hình Faster R-CNN đã nhận dạng được các đối tượng như con người (person), xe ô tô (car), xe mô tô (motorcycle). Tuy nhiên, có nhiều đối tượng chưa được nhận dạng được dó là các đối tượng khá nhỏ, các đối tượng ở xa, các đối tượng bị che khuất ... Đây cũng là khó khăn lớn trong nghiên cứu này, để mô hình nhận dạng được các đối tượng này thì cần phải xây dựng thêm tập cơ sở dữ liệu cho mô hình học, ngoài ra còn cần phải có cấu hình phần cứng tương xứng.

Như vậy, đối với các đối tượng di động thì mô hình đã nhận dạng được thông qua thực nghiệm như Mục 3.4.2.1 và Mục 3.4.2.2 ở trên. Việc đánh giá độ chính xác nhận dạng của các đối tượng di động tác giả chưa thể thực hiện được vì có những khó khăn trong quá trình tạo ra các tình huấn thực nghiệm để kiểm tra độ chính xác nhận dạng của mô hình này. Phần này tác giả sẽ triển khai thực hiện ở các nghiên cứu tiếp theo.

62

KẾT LUẬN

Một phần của tài liệu Đề tài nghiên cứu ứng dụng thuật toán mạng nơ ron tích chập nhận dạng các đối tượng di động (Trang 73 - 77)

Tải bản đầy đủ (PDF)

(80 trang)