Kiến trúc mạng Multi-label CNN [8]

Một phần của tài liệu Truy tìm đối tượng dựa vào thuộc tính cho dãy camera quan sát (Trang 38 - 40)

6 Kết Luận

3.7 Kiến trúc mạng Multi-label CNN [8]

Tuy nhiên với hướng tiếp cận này, rất phụ thuộc vào việc chia tấm hình thành các phần khác nhau. Nếu phân chia không cẩn thận, các thuộc tính sẽ không nằm vào phần mà chúng ta đã chọn trước, hoặc có một số thuộc tính không nằm trong dự định của chúng ta. Hơn thế nữa việc chia này rất phức tạp, đòi hỏi chi phí cao trong quá trình thực hiện. Vì vậy cách tiếp cận này chỉ dừng ở việc nghiên cứu, rất khó ứng dụng vào thực tiễn.

Phương pháp nghiên cứu

Trong phần này sẽ trình bày ý tưởng dẫn đến mô hình đề xuất, cách hiện thực mô hình đề xuất và các thử nghiệm để khảo sát, đánh giá sự tác động của các nhánh trong mô hình.

4.1 Ý tưởng thiết kế thử nghiệm

Tái định danh được chia làm hai hướng, một hướng sẽ truy tìm một đối tượng nào đó dựa vào thuộc tính, hướng còn lại sẽ tìm chính xác đối tượng đó ở đâu trong mạng lưới camera nếu biết trước đối tượng. Cả hai hướng này đều thuộc bài toán phân loại, truy tìm theo thuộc tính là phân loại nhiều nhãn, còn truy tìm theo đối tượng là phân loại chỉ một nhãn duy nhất. Liệu chúng ta có thể xây dựng một mô hình cho cả hai bài toán được không? Dựa vào câu hỏi trên và kết quả rút trích đặc trưng rất tốt của bài báo [1] đã hình thành nên ý tưởng xây dựng mô hình Top Drop Block cho bài toán truy tìm đối tượng theo thuộc tính bằng việc kế thừa một phần của mô hình trước đó.

Năm 2020, tác giả Quispe và các cộng sự đã xây dựng rất thành công mô hình Top DropBlock cho việc nhận dạng đối tượng dựa trên nội dung ảnh. Hơn nữa công trình này là một trong những công trình có độ chính xác cao trong những năm gần đây. Với ý tưởng là thay vì quá tập trung học vào những vùng đặc trưng có nhiều thông tin như cách truyền thống, bỏ qua các thông tin liên quan khác, nhóm nghiên cứu này đã kết hợp cả hai việc, vẫn kế thừa được phương

pháp truyền thống tập trung học những vùng đặc trưng có nhiều thông tin. Bên cạnh đó, tác giả còn tăng cường mạng học cách vùng đặc trưng có ít thông tin hơn, với hy vọng khi khai phá những vùng này sẽ mạng lại các thông tin quyết định cần thiết cho mạng. Chúng ta có thể thấy được một số kết quả rất khả quan từ công trình này, ở hinh 4.1, với việc mạng đã mở rộng khai phá các vùng đặc trưng khác để tăng khả năng quyết định.

Một phần của tài liệu Truy tìm đối tượng dựa vào thuộc tính cho dãy camera quan sát (Trang 38 - 40)

Tải bản đầy đủ (PDF)

(73 trang)