Tăng thêm số lượng ảnh đầu vào

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân lớp đồng phục sinh viên dùng mô hình học sâu (Trang 78 - 83)

Số lượng hình ảnh đầu vào luôn là một vấn đề được quan tâm với những kỹ thuật phân lớp hình ảnh bằng CNN. Các kỹ thuật xử lý ảnh đã được áp dụng để gia tăng đáng kể số lượng hình ảnh đầu vào cho tập huấn luyện. Như đã nêu, tác giả đã sử dụng 5 phép biến đổi ảnh cơ bản để có được tập ảnh đầu vào có hơn 12000 ảnh chia thành 4 phân lớp.

Số lượng ảnh đầu vào gia tăng sẽ dấn đến thời gian xử lý của máy tính sẽ dài hơn với mỗi lần huấn luyện. Do đó ở giai đoạn đầu tác giả sẽ giảm bớt số lần huấn luyện xuống còn 100 lần và tiếp tục thử nghiệm với 3 kích thước như trước.

Hình 4.13. Kết quả thực nghiệm với bộ dữ liệu tăng thêm kích thước 50 x75 Với sự gia tăng số lượng ảnh cho tập huấn luyện, mô hình CNN đã có sự thay đổi rõ rệt. Sự biến thiên của độ lỗi ở bước thực nghiệm này tương đối mịn hơn so với giai đoạn chưa tăng thêm số lượng ảnh, độ lỗi có chiều hướng giảm dần qua các lần huấn luyện. Chỉ với 100 lần huấn luyện, mô hình đã đạt được kết quả phân lớp với độ chính xác hơn 90% và độ lỗi giảm xuống mức dưới 20%. Độ lỗi ghi nhận ở lần thứ 100/100 là tối ưu nhất với giá trị 0.18078, thấp hơn cả khi huấn luyện 400 lần như ở giai đoạn trước. Với sự cải thiện của kết quả ở lần huấn luyện thứ 100 này, mô hình có thể vẫn còn có thể học nhiều lần hơn nữa để cho kết quả khả quan hơn.

Hình 4.14. Kết quả thực nghiệm với bộ dữ liệu tăng thêm kích thước 150x225 Khác với khi chưa sử dụng tập dữ liệu ảnh được tăng thêm, với số lượng ảnh lớn hơn nhiều, dù cho kích thước ảnh của đầu vào như thế nào thì đều cho kết quả khá tốt. Cũng giống với khi dùng kích thước tập đầu vào 50x75 pixel, độ lỗi của mô hình CNN với kích thước 150x225 pixel cũng giảm dần đều qua 100 lần huấn luyện. Độ lỗi ghi nhận ở lần thứ 100/100 là tối ưu nhất với giá trị 0.02508, thậm chí kết quả này còn cao hơn khi dùng kích thước 50x75 pixel.

Ta tiến hành so sánh các kết quả khi sử dụng 3 kích thước 50 x 75, 100 x 150, 150 x 225 pixel với tập ảnh đầu vào đã được tăng thêm bằng cách phép biến đổi hình ảnh qua 100 lần huấn luyện.

Bảng 4.5. Thống kê kết quả thực nghiệm với bộ dữ liệu tăng thêm

Kích thước Model_Accuracy Model_Loss Test_Accuracy Time cost

100 x 150 0.9809 0.0502 98.7882% 5550s

150 x 225 0.9906 0.02508 98.7882% 9557s

Hình 4.15. Tổng hợp kết quả sau khi huấn luyện 100 lần với bộ dữ liệu tăng thêm

Qua biểu đồ và hình ảnh minh họa ta có thể thấy với cả 3 kích thước khác nhau, độ chính xác của mô hình khi huấn luyện và kiểm thử đều đạt kết quả rất khả quan và xấp xỉ nhau trong khoảng từ 94% đến 99%, cụ thể giá trị thấp nhất với kích thước 50x75 pixel là 94.64%, cao nhất với kích thước 150x225 pixel 99.06%. Khi kích thước ảnh nhỏ 50x75 pixel thì độ chính xác phân lớp thấp hơn gần 5% so với độ chính xác phân lớp với các kích thước lớn hơn. Chỉ còn giá trị model_loss có sự khác biệt rõ rệt. Đây có thể là một tiêu chí để ta lựa chọn kích thước đầu vào cho tập huấn luyện.

Tuy nhiên sau 100 lần huấn luyện, theo như biên độ thay đổi của các giá trị thì khả năng mô hình vẫn còn có khả năng cái thiện hơn nữa, do đó luận văn đề xuất tiếp tục tiến hành thực nghiệm với 300 lần huấn luyện.

Bảng 4.6. Thống kê kết quả thực nghiệm huấn luyện 300 lần với bộ dữ liệu tăng thêm

Kích thước Model_Accuracy Model_Loss Test_Accuracy Time cost

50 x 75 0.9809 0.03648 99.2289% 3173s 100 x 150 0.9967 0.01230 99.5594% 12535s 150 x 225 0.9979 0.01630 99.2289% 42853s 0.9464 0.9809 0.9906 0.1808 0.0502 0.02508 0.944368 0.987882 0.987882 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

50x75 pixel 100 x 150 pixel 150 x 225 pixel

Hình 4.16. Tổng hợp kết quả sau khi huấn luyện 300 lần với bộ dữ liệu tăng thêm

Hình 4.17. Huấn luyện 300 lần với bộ dữ liệu tăng thêm kích thước 50 x 75

Với lần thử nghiệm với 300 lần huấn luyện, mô đã cho thế những kết quả rõ nét hơn. Độ lỗi của mô hình đã gần tiến về giá trị 0, tuy nó đã tương đối bão hòa và không thể đạt giá trị tuyệt đối nhưng đây là một cải thiện rất lớn. Trong 100 lần huấn luyện đầu tiên độ lỗi giảm mạnh đến khoảng 0.2 và từ đó về sau giảm đều qua mỗi lần huấn luyện cập nhật các trọng số. Giá trị hàm lỗi sau 300 lần huấn luyện bây giờ chỉ còn 0.03648, giảm gần 6 lần khi chỉ huấn luyện 100 lần.

So sánh kết quả khi huấn luyện 300 lần với cả 3 kích thước tập ảnh đầu vào, ta thấy được độ chính xác của mô hình của 3 tập xấp xỉ bằng nhau, độ lỗi cũng đã

0.9809 0.9967 0.9979 0.03648 0.0123 0.0163 0.992289 0.995594 0.992289 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

50x75 pixel 100 x 150 pixel 150 x 225 pixel

được cải thiện đáng kể. Đó là so sánh dựa trên kết quả, nếu nhìn nhận ở góc độ năng suất của mô hình ta sẽ thấy mô hình huấn luyện với kích thước nhỏ là tốt hơn. Một lần huấn luyện với tập ảnh có kích thước 50 x 75 pixel trung bình mất khoảng 10s, trong khi với tập ảnh có kích thước 100 x 150 pixel mất khoảng 42s và 142s đối với tập ảnh có kích thước 150 x 225 pixel. Xét tổng quan kể cả về hiệu suất và năng suất của mô hình thì ta nên lựa chọn mức độ trung bình đáp ứng được cả 2 tiêu chí đó là tập ảnh có kích thước 100 x 150 pixel.

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân lớp đồng phục sinh viên dùng mô hình học sâu (Trang 78 - 83)

Tải bản đầy đủ (PDF)

(88 trang)