Kiến trúc mạng nơ ron tích chập của YOLO

Một phần của tài liệu Nghiên cứu nhận diện và phát hiện đối tượng dựa trên nên tảng hệ thống iot camera (Trang 26 - 28)

Trong thử nghiệm của mình, nhóm tác giả sử dụng tham số chia lưới S = 7, số hình bao dự đoán B = 2, số lớp gán nhãn C = 20, do đó kết quả cần ước lượng 7*7*30 giá trị. Đây cũng là đầu ra của mô hình mạng nơ ron được thiết kế trong công trình.

Mạng nơ ron được nhóm tác giả huấn luyện với tiêu chí tối ưu sai số tổng bình phương của các giá trị đầu ra. Sai số tổng bình phương là một sai số hay được sử dụng trong huấn luyện mạng nơ ron vì nó dễ dàng để tính đạo hàm để tối ưu. Tuy nhiên do bản chất trong kết quả đầu ra có nhiều loại kết quả khác nhau và chúng không cùng ngữ cảnh nên nếu sử dụng trực tiếp sai số tổng phương có thể sẽ không phù hợp và nó sẽ không cân đối được giữa sai số định vị và sai số phân lớp. Ngoài ra do trong dữ liệu học sẽ có rất nhiều mắt lưới không liên quan đến đối tượng, kết quả học có thể bị lệch chỉ với việc đẩy các giá trị độ tin cậy của các hình bao về 0 để đạt được hiệu quả trên nhóm những mắt lưới đó. Như vậy kết quả mạng sẽ trở nên không ổn định và có khả năng sẽ loại hết những trường hợp có đối tượng.

Để khắc phục sự mất cân bằng sai số do ngữ cảnh dữ liệu khác nhau, các tác giả đã thay đổi trọng số trong các thành phần của hàm lỗi, cụ thể là tăng mức sai số cho việc ước lượng các tọa độ hình bao đối tượng và giảm mức sai số cho các ước lượng độ tin cậy của hình bao không liên quan đến đối tượng nào. Cụ thể là các trọng số λcoord and λnoobj. Trong thử nghiệm làλcoord = 5 và λnoobj = 0.5. Sai số cũng được đặt mức như nhau giữa các hình bao lớn và hình bao bé. Hàm lỗi tổng quát như sau:

Trong đó ám chỉ đối tượng có xuất hiện tại mắt lưới thứ i và

ám chỉ rằng hình bao dự đoán thứ j ứng với lưới thứ i là kết quả của đối tượng

KẾT LUẬN

Phát hiện và nhận dạng đối tượng trong hệ thống IoT camera là một vấn đề có tính thời sự và khả năng ứng dụng cao trong thực tế xã hội. Liên quan đến bài toán này có nhiều vấn đề cần nghiên cứu chuyên sâu về cả xử lý ảnh lẫn học máy. Luận văn đã hệ thống một số vấn đề cơ bản trong bài toán phát hiện và nhận dạng đối tượng trong hệ thống IoT camera, cả trong nghiên cứu lý thuyết cũng như trong cài đặt thực tế. Những vấn đề này có thể tóm tắt lại như sau:

 Tổng quan các khái niệm về hệ thống IoT camera cũng như các đặc điểm của dữ liệu video và các bài toán phát hiện đối tượng cũng như nhận diện đối tượng. Trên cơ sở đó, luận văn đưa ra sơ đồ xử lý chung cho quy trình phát hiện và nhận diện đối tượng trên hệ thống IoT camera.

 Lý thuyết về một số kỹ thuật phục vụ phát hiện và nhận diện đối tượng trong hệ thống IoT camera, cụ thể là một số kỹ thuật tiền xử lý như phát hiện chuyển động và tách màu nhằm mục tiêu xác định sơ bộ khung hình có đối tượng hay không, tiếp đến là các nội dung phát hiện đối tượng và nhận diện đối tượng theo quy trình của công trình YOLO.

Luận văn hoàn thành nhưng để xây dựng được một hệ thống phát hiện và nhận dạng đối tượng trong hệ thống IoT camera phù hợp với yêu cầu thực tế thì còn nhiều vấn đề phải giải quyết như vấn đề xử lý tăng tính chính xác với những dữ liệu video có độ phân giải thấp phù hợp với khả năng thu thập dữ liệu trong thực tế, vấn đề cải thiện thuật toán để phù hợp với yêu cầu xử lý dữ liệu thời gian thực…

Một phần của tài liệu Nghiên cứu nhận diện và phát hiện đối tượng dựa trên nên tảng hệ thống iot camera (Trang 26 - 28)

Tải bản đầy đủ (DOCX)

(28 trang)
w